2016-10-25 18 views
7

Soruları ayrıştırmak için Stanford POS tagger kullanıyorum. Deneyimimde mevcut olan en iyi POS etiketlerinden biri, ancak "Nixon ne zaman öldü?" Gibi basit bir soru. yanlış"Nixon ne zaman öldü?" Diye ayrılabilecek bir POS tagger var mı? doğru şekilde?

When_WRB did_VBD Nixon_NNP die_NN

sorun açıklamalı "die_NN" dir. Açıkçası "ölmek" bu durumda bir isim değil, bir fiildir. Bu daha fazla soru ile olur. Benim sorularım:

  • Bu cümle için doğru ek açıklama vermek için Stanford POS tagger'ı düzeltmek mümkün mü? Veya alternatif olarak, hangisinin doğru olduğu birden fazla ek açıklama üretmesine izin verin?
  • Java arabirimine sahip bu tür soruları doğru şekilde ayrıştırabilen başka bir POS etiketleyicisi var mı?
+3

Yani, standart yasal uyarı, her zaman her şeyi doğru bir şekilde alacak bir POS tagger bulamayacağınızdır. Ama, sanırım Stanford POS tagger aslında bunu hak ediyor mu? En azından kodun en son sürümünde? Eğer "Nixon ne zaman öldü" yazısını corenlp.run içine yazarsanız, "die" yi bir VB olarak doğru şekilde etiketler. –

+0

@Gabor, haklısınız. En yeni beta sürümüne geçerseniz, iyi çalışır. Yorumunuzu bir cevaba teşvik edebilir misiniz? O zaman sana lütfunu verebilirim. –

cevap

0

Açıklamalarda belirtildiği gibi, "The Stanford POS tagger şu anda doğru oluyor."

Lol ... Eğer istemiyorsa lütfunu alacağım.

+0

Argggh ... İsteğinizi vermeden önce isminizi kontrol etmedim çünkü süresinin dolması için sadece birkaç dakika kaldı. Gabor Angeli olduğunu sanıyordum. Bu adil değil. –

+0

Gerçekten haksızlık değil. Gönderiim, yorumlar bölümüne atıfta bulunarak bir cevabı açıkça belirtiyor. Ben asla Gabor olduğunu iddia etmedim ... Madalyayı vermeden önce isim veya cevap okumadığın için üzgünüm ... :( – nckbrz

İlgili konular