"Çok", "birkaç", "çok" gibi değiştiricileri sınıflandırabilmesi gereken bir proje üzerinde çalışıyorum "bazı" vb asgari yüzdeleri Örneğin "a lot"
için"Çok", "Birkaç", "biraz", "bazı" gibi kelimeleri sınıflandırmanın kolay yolu
içine - Ben sadece bu düzenleyiciler ve sayısal değerler, örneğin ilgilidir büyük sözlüğünü oluşturma düşünüyorum şu anda>80%
a few
->15%
some
->10%
lots
->80%
Ancak bu çok zahmetli ve muhtemelen bütün senaryoları karşılamayacaktır. Bunu yapmak için daha kolay bir yol var mı, yoksa bu amaçla zaten var olan bir NLP aracı var mı - tercihen python'da (ya da zaten var olan bir veritabanında?)
Yani "% 15" ile "% 15" arasındaki bir haritayı kastediyorsunuz ve daha sonra "bir kaç" gibi sözcükleri "Word2Vec" ile "küçük" olarak adlandırıyorsunuz? – abagshaw
Yani "bir kaç", "biraz" kelimesini word2vec ile alabilir ve ti çalışıp çalışmadığını görebilirsiniz. Sadece bir fikir ve deneyebilirsiniz. –
Bu ilginç. Bunu bir atış yapacağım. "Çok", "birkaç" gibi en yaygın 100 kelimeyi, bazı sayısal değerler ile ilişkilendiren en yaygın kelime için bir ceset mi yoksa veri toplama mı olduğunu biliyor musunuz? Bir başlangıç noktası olsaydı, oradan word2vec kullanabilirdim. – abagshaw