CMU's TurboParser tarafından oluşturulan bağımlılık ayrıştırma ağaçlarını kullanmaya çalışıyorum. Kusursuz çalışıyor. Ancak problem, çok az dokümantasyon olmasıdır. Ayrıştırıcılarının çıktısını tam olarak anlamanız gerekir. indeksleriTurboParser'ın bağımlılık ayrıştırma çıktısı ne anlama geliyor?
1 I _ PRP PRP _ 2 SUB
2 solved _ VBD VBD _ 0 ROOT
3 the _ DT DT _ 4 NMOD
4 problem _ NN NN _ 2 OBJ
5 with _ IN IN _ 2 VMOD
6 statistics _ NNS NNS _ 5 PMOD
7 . _ . . _ 2 P
Çeşitli kolonlar için neyi anlamamıza yardımcı olabilecek tüm belgeleri bulamadı ve nasıl: Örneğin, cümle şu çıktıyı üretir "Ben istatistikleri ile sorunu çözdü" ikinci sütunda (2, 0, 4, 2, ...) oluşturulur. Ayrıca, neden konuşma etiketlerine ayrılmış iki sütun olduğunu bilmiyorum. Herhangi bir yardım (veya harici belgelere bağlantı) çok yardımcı olacaktır.
P.S. Ayrıştırıcılarını denemek isterseniz, here is their online demo.
P.P.S. Lütfen Stanford'un bağımlılık ayrıştırma çıktısını kullanmayı önermeyin. Stanford'un NLP sisteminin yaptığı gibi doğrusal programlama algoritmaları ile ilgileniyorum.