'eat', 'eat', 'eats' gibi dizgiyi dönüştürmek istiyorum. Ben lemmatizasyonu çözüm olarak aradım ve buldum, ancak karşılaştığım tüm parçalayıcı araçlar wordlist veya dictionary-lookup kullanıyor. Sözlü
Son birkaç gündür kafamı kırıyordum. Tüm SO arşivlerini araştırdım ve önerilen çözümleri denedim, ancak bunu işe yaramayacak gibi görünmüyor. 2000 06, 1995 -99 vb. Gibi klasörlerde txt belgeleri kümel
PUANI ALMAK: Ben parametresini 'cutoff' ekleme seçeneği biliyor import difflib
best_match = difflib.get_close_matches(str,str_list,1)[0]
, ama nasıl almak için dışarı bulamadık eşiği ayarladıktan
'a aktarma Python'da bazı metin çözümleme çalışmaları yapıyorum. Ne yazık ki, belirli bir paketi kullanmak için R'ye geçmem gerekiyor (maalesef paket Python'da kolayca kopyalanamaz). Şu metin yaklaşık
Amacım, web sitesini "Inflammatory bowl disease" anahtar sözcüğünü içeren web sayfalarını kazımaktır. Sonra toplanan listede metin analizi uygulamak ve semptomlar veya tedaviler gibi bilgileri çıkarma