Temel olarak Solr'da kelime veya pdf belgeleri indekslemeye çalışıyorum ve ExtractingRequestHandler'ı buldum, ancak C# içinde kod yazmayı nasıl yapamayacağımı, Solr wiki: http://wiki.apache.org/solr/ExtractingRequestHandler.Dizin pdf belgeleri Solr dan C# istemci
Solr 3.4'teki Solr zip dosyasındaki/solr dizinindeki dosyaları kullanarak Solr 3.4'ü Tomcat 7'ye (7.0.22) yükledim ve hiçbir şey değiştirmedim. ExtractingRequestHandler, solrconfig.xml içindeki kutudan yapılandırılmalı ve kullanıma hazır, değil mi?
Bazılarınız, HTTP POST isteğini nasıl oluşturduğunuza ve Solr wiki'de curl kullanılarak yapıldığı gibi bir PDF dosyası yüklediğinize dair bir C# (HttpWebRequest) örneği verebilir mi?
Bu sitenin her tarafına bakıyorum ve diğerleri, bunun nasıl yapıldığına dair bir örnek veya öğretici bulmaya çalışıyor, ancak hiçbir şey bulamadım.
DÜZENLEME:
Sonunda o SolrNet kullanarak çalışmak için başardı!
- apache-Solr hücreli-3.4.0.jar dosyasından: Eğer Solr zip adresinin Solr yükleme dizininde bir lib-klasöre bu kopyalamanız gerekir çalışması için de
bir dist klasörü
- içerik contrib \ çıkarma \ SolrNet 0.4.0 beta 2 ile
, bu kod işi yapar lib dizini:
Startup.Init<IndexDocument>("YOUR-SOLR-SERVICE-PATH");
var solr = ServiceLocator.Current.GetInstance<ISolrOperations<IndexDocument>>();
using (FileStream fileStream = File.OpenRead("FILE-PATH-FOR-THE-FILE-TO-BE-INDEXED"))
{
var response =
solr.Extract(
new ExtractParameters(fileStream, "doc1")
{
ExtractFormat = ExtractFormat.Text,
ExtractOnly = false
});
}
solr.Commit();
Sorun için özür dilerim. Umarım diğerleri bunu faydalı bulacaktır.
Çok faydalı bilgiler -> benim için çalışıyor. – FrenkyB
IndexDocument sınıfınızı gönderir misiniz? Teşekkürler! – CmdrTallen
ExtractParameters kullanmak için SolrNet> 0.3.1 ("Install-Package SolrNet -Pre") – CmdrTallen