Son birkaç gündür soundex, metaphone ve diğer dize arama teknikleri üzerinde çalışıyorum ve her iki algoritma da, İngilizce'ye çevrilmiş ingilizce olmayan sözcükleri işlemede iyi çalışır. Bununla birlikte, bu tür bir araştırmanın orijinal, çevrilmemiş diller, Almanca, Norveççe ve hatta Cyril alfabeleri gibi alfabetik harflerle yazılması için kullanmam gerekliliğiydi.İngilizce olmayan karakterler için soundex/metaphone'u etkinleştirme
Bu alfabeleri tamamen işleyebilen herhangi bir arama algoritması var mı? Yoksa Lucene gibi üçüncü taraf tam metin arama kütüphanelerini kullanmaktan daha mı iyi olurum? Sonuç olarak, soru 'Lucene, İngilizce olmayan alfabeleri ele alıyor mu?'
Kullanım durumunuz yalnızca ingilizce olmayan dillerde metin araması yapıyorsa, soundex'e ihtiyacınız olmayabilir. Ire_and_curses'ın dediği gibi Lucene'ye uygun bir Analizöre ihtiyacınız var. Aynı kelimenin farklı yazı türlerini işlemek istiyorsanız, fonetik eşleme algoritmasına ihtiyacınız olacaktır. Kullanım durumunuz hakkında daha fazla şey söyleyebilir misiniz? –