Python'da NLTK araç takımı için varsayılan ayarlayıcı nedir?

Varsayılan POS etiketleme ve varsayılan belirteçlerini kullanıyorum ... ve yeterli görünüyor. Onların da varsayılan dolandırıcılarını istiyorum.Python'da NLTK araç takımı için varsayılan ayarlayıcı nedir?

NLTK araç seti kitabını okuyorum, ancak varsayılan bir kilitleyicisi gibi görünmüyor mu?

kaynak

2009-11-06 TIMEX

nltk.ne_chunk() yöntemiyle entity chunking adlı kutudan çıkabilirsiniz. bir örgüt olarak

Tree('S', [Tree('PERSON', [('Barack', 'NNP')]), Tree('ORGANIZATION', [('Obama', 'NNP')]), ('lives', 'NNS'), ('in', 'IN'), Tree('GPE', [('Washington', 'NNP')])])

Bir kişi olarak Barack tanımlayan fakat Obama: içinde

nltk.ne_chunk([('Barack', 'NNP'), ('Obama', 'NNP'), ('lives', 'NNS'), ('in', 'IN'), ('Washington', 'NNP')])

sonuçları: Bu POS listesi dizilerini etiketli sürer. Yani mükemmel değil.

kaynak

2009-11-06 13:49:23 ealdent

Eğer named_entities hakkında çok endişelenmiyorum, ancak genel olarak yığınlama yapmam. Örneğin, "sarı köpek" bir yığındır ve "koşuyor" bir yığındır. – TIMEX

Evet, bilgim için varsayılan bir şey yok (nltk hakkında her şeyi bilmeme rağmen, emin olmak için). Bir RegexpChunkParser kullanabilirsiniz, ancak kuralları kendiniz geliştirmelisiniz. Burada bir örnek var: http://gnosis.cx/publish/programming/charming_python_b18.txt – ealdent

Ya da varsayılan bir ayırıcı/sığ ayrıştırıcı bulamadık. Kitap, örnek özelliklerle nasıl yapılacağını ve eğitileceğini anlatsa da. İyi performans elde etmek için ek özelliklerle gelmek çok zor olmamalıdır.

Training Classifier-based Chunkers konusundaki Bölüm 7'nin bölümüne bakın.

kaynak

2009-11-07 04:10:04

Python'da NLTK araç takımı için varsayılan ayarlayıcı nedir?

cevap

İlgili konular