2013-07-12 27 views
5

Ben bir klasörde bu 3 dosya var ve hepsi Lucene tarafından oluşturulan bir endeks ile ilgilidir:anlama lucene segmentleri

  • _0.cfs
  • segments_2
  • segments.gen

Hepsi niçin kullanılırlar ve lucen'in indeksleriyle nasıl çalıştığı hakkında biraz daha fazla bilgi edinmek için bunların herhangi birini insan tarafından okunabilir bir formata dönüştürmek mümkün müdür?

cevap

6

İki segment dosyası, segmentler hakkında bilgi depolar ve .cfs, diğer dizin dosyalarından (dizin, depolama, silme, vb. Dosyalar) oluşan bir bileşik dosyadır.

bir Lucene dizin oluşturmak için kullanılan dosyaların farklı türde belgeler için, hiçbir, Lucene dosyalar okunabilir insan değil, genel olarak bu summary of file extensions

bakın. İnsan okunabilirliğinden daha fazla verimlilik ve hız için tasarlanmıştır. İnsan tarafından okunabilir bir format elde etmenin yolu, onlara Lucene API'sı aracılığıyla (Luke veya Solr ya da bunun gibi bir şeyden) erişmektir.

Kullanımdaki dosya biçimlerinin tam olarak anlaşılmasını istiyorsanız, codecs package bakmak için uygun yer olabilir.