2009-07-30 20 views

cevap

6

Maalesef Sfenks endeksleyemez bu dosya türünü doğrudan. Metin içeriklerini bir veritabanına veya an XML format that Sphinx can understand içine almanız gerekir.

+0

, üzerinde başka bir yöntemi tavsiye eder misiniz? –

+0

Kullandığınız sunucu tarafı diline göre değişir. Ruby/Rails ise, sıfırdan bir sistem oluşturmuyorsanız (ActiveRecord'u kullanmak yerine) tüm kitaplıkların XML'yi desteklemediğini biliyorum. Bu yüzden veritabanını kullanırdım. Aksi takdirde, tamamen size kalmış. Ruby'yi kullanmıyorsanız, dil seçiminiz için kütüphanelerin neler olduğuna bakın, neler yapabileceklerini/yapamayacağınızı görün. – pat

9

Bunun için kullandığım yöntem pdf2text ve antiword. Bunların her ikisini de pdfs ve word belgelerinin içeriğini veritabanına dökmek için kullanıyorum. Oradan Sfenks ile gezinmek kolay.

+0

Sizin gibi benim için de aynı yöntemi kullanıyorum. – Johny

İlgili konular