PDF dosyaları ile tam metin arama kullanma SQL Server 2005'te PDF dosyalarını dizinleme ile ilgili garip bir sorun var ve birilerinin yardımcı olabileceğini umuyorum. Veritabanım, MediaFileId int identity pk, FileContent image ve FileExtension varchar (5) ile MediaFile adlı bir tablonun var. Web uygulamasımın hiç bir sorun olmadan bu tablodaki dosya içeriğini saklıyorum ve doc, xls, vs üzerinde tam metin arama yapmadan problem çözmeden kullanabilmem mümkün değil - tek dosya uzantısı çalışmıyor. Tabloda kayıtlı PDF dosyalarının içinde bulunduğunu bildiğim kelimeler için bu tabloda tam metin aramaları yapıldığında, bu dosyalar arama sonuçlarında döndürülmez.SQL Server 2005
İşletim sistemi Windows Server 2003 SP2 ve Adobe iFilter 6.0 yükledim. this blog entry talimatları ardından, aşağıdaki komutları yürütür: Bundan sonra
exec sp_fulltext_service 'load_os_resources', 1;
exec sp_fulltext_service 'verify_signature', 0;
, ben SQL Server yeniden ve iFilter PDF uzantıları için aşağıdaki komutu yürüterek doğru takıldığından emin doğrulandı:
select document_type, path from sys.fulltext_document_types where document_type = '.pdf'
Bu döndürür doğru görünüyorsa aşağıdaki bilgiler:
document_type: .pdf
yolu: C : \ Program Files \ Adobe \ PDF IFilter 6.0 \ PDFFILT.dll
Sonra (yeniden) endeksine sütuna ve türü olarak FileExtension olarak fileContent seçerek MediaFile masaya endeksi oluşturdu. Sihirbaz dizini oluşturur ve başarıyla tamamlar. Ben kelimesini içeren tablodaki PDF dosyaları kesinlikle olduğunu biliyoruz ancak
SELECT MediaFileId, FileExtension FROM MediaFile WHERE CONTAINS(*, '"house"');
Bu, bu terimi içeren DOC dosyalarını döndürür, ancak herhangi bir PDF dosyaları: test etmek için, böyle bir arama yaptıktan ediyorum ev.
Bu arada, birkaç dakika boyunca bir kez çalışıyorum, yukarıdaki aramada doğru PDF dosyaları döndü, ancak daha sonra hiç bir nedenden ötürü yeniden çalışmayı durdurdu.
Adobe iFilter yüklüyse ve yüklü gibi görünse bile, SQL Server 2005'i PDF'leri dizine eklemeden ne gibi bir fikir verebilir?
*** NASIL ***: 1.) 'iFilter yüklü PDF programatically' doğrulamak? 2.) créate ** tam metin dizini ** 'programatik'? 3.) ** tam yeniden indeks ** 'programatik' mi? – Kiquenet