2010-05-26 11 views

cevap

2

Solr'a metin almak için ayıklamanız gerekir. Lucene Bağlayıcı Çerçevesi sadece bunu yapmak içindir. Bir şekilde ham metni başka şekilde alırsanız, bilgi almak için DataImportHandler'u kullanabilirsiniz. Metni doğru bir şekilde dizine eklerseniz ve şemayı iyi yapılandırırsanız, başarılı arama sonuçları elde edebilmeniz gerekir.

+0

Apache Tika filtresi nereye sığar? –

+0

Bunun olduğundan emin değilim. Tika'nın desteklenen belge formatlarına bakın: http://tika.apache.org/formats.html, çeşitli Microsoft belge formatlarını desteklemektedir. Bunlardan hangisinin Sharepoint ile ilgili olduğunu bilmiyorum. İdeal olarak, Tika bir dosyadan metin ve meta-verileri desteklenen bir biçimde ayıklamanızı sağlar, böylece depolamayı (dosya sistemi, dizinler, tarama) kendiniz düzenleyebilirsiniz. Ama neden LCF'yi kullanmıyorsun? –

+0

Evet, LCF kullanarak devam ettim, LCF tam metin aramayla ilgilenecek mi? –