Benzer bir anahtar kelime kümesiyle bir ifadeyi veya anahtar kelimeyi eşleştirmem gereken bir proje üzerinde çalışıyorum. Aynı anlam için semantik analiz yapmam gerekiyor.Benzer anlama veya anlambilime sahip ifadeleri eşleştirmek için NLP araçları hangi araçları kullanacak
bir örnek:
İlgili QT
ucuz sağlık sigortası
uygun fiyatlı sağlık sigortası az
ucuz sağlık sigortası
Ortak Anlamı
düşük maliyetli sağlık sigortası
sağlık planı
Düşük maliyetli sağlık sigortası
Burada Ortak Anlamı sütunundaki sözcük, İlgili QT sütununun altında eşleşmelidir. Aynı şeyi yapmak için bir takım araçlara ve tekniklere baktım. S-Match çok umut verici görünüyordu, ama Java'da değil Python'da çalışmam gerekiyor. Ayrıca, Latent Semantic Analysis iyi görünüyor, ancak anahtar kelime eşlemesi yerine Anahtar Kelime'ye dayanan belge sınıflandırması için daha fazla olduğunu düşünüyorum. NLTK ile biraz tanıdık. Birisi hangi yöne doğru ilerlemem gerektiğini ve hangi araçların aynı şekilde kullanması gerektiğine dair bir fikir verebilir mi?
Projenizin kapsamı nedir at Python uygulaması - http://clic.cimec.unitn.it/composes/toolkit/installation.html
Düşük maliyetli sağlık sigortası gibi semantik olarak benzer kelimeleri yaklaşık 200000 kelime grubundan çıkarmak zorundayım. Kümelemeyi, bu kelime üzerinde bir başlangıç algoritması çalıştırdıktan sonra, kümedeki semantik olarak benzer kelimeleri eşleştirecek türler (kelimeler) oluşturmak için kullanmam gerektiğini düşünüyorum. Bütün prosedür denetimsiz. –