2016-04-13 7 views
0

ve Stanford Log-linear Part-Of-Speech Tagger numaralı metinlerden NER ve POS etiketi vermeye çalıştım.Can NER Stanford, java dosyasında arayabilir mi?

Sana POStag

bir örneğini
import edu.stanford.nlp.tagger.maxent.MaxentTagger; 

public class POSTag { 
  static MaxentTagger tagger = new MaxentTagger("english_language_pos.tagger"); 

  public static void main(String[] args) throws IOException{ 
   String text = "Sarah and I go to Samsung office in Korea." 
   String tagged = tagger.tagString(text); 

   System.out.println(tagged); 
  } 
} 

verelim çıkışı:

Sarah_NNP and_CC I_PRP go_VBP to_TO Samsung_NNP office_NN in_IN Korea_NNP ._. 

Ve NER Stanford için
, komut satırından çalıştırmak zorunda:

java -mx500m -cp stanford-ner-3.5.2.jar edu.stanford.nlp.ie.crf.CRFClassifier -loadClassifier indonesian_language_ner.gz -textFile E:/file.txt > E:/file_ner.txt 

Sorum şu: Stanford NER'i java uzantılı (file.java) dosya olarak nasıl arayabilirim? Komuta hattından başka Stanford NER'i aramanın bir yolu var mı? Veya java dosyasından çağrılan NER vermek için kullanabileceğim başka bir araç veya kitaplık var mı?

***** düzenleme:
Böyle haline NER çıktısını gerekir:

Sarah_PERSON and_O I_O go_O to_O Samsung_ORGANIZATION office_O in_O Korea_PLACE ._O 

***** düzenlemek

** Bilginize: Windows 8.1

kullanmak Ben yardımcı olur umarım

String model = "english.all.3class.distsim.crf.ser.gz"; 
  String text = "file.txt"; 

  AbstractSequenceClassifier<CoreLabel> classifier = CRFClassifier.getClassifier(model); 
  classifier.classifyAndWriteAnswers(text); 

:

cevap

1

böyle bir şey yapabilirdi.

+0

Çıktıya ihtiyacım var NER etiketi ile metin. Gönderiyi detay için düzenledim. –

+0

Bu işe yaramalı. Etiketleme varsayılan olarak '/' ile yapılır, başka bir karaktere kolayca uyum sağlayabilirsiniz. – joel314

+0

Çıktıyı konsol yerine yazdırma yerine nasıl yazabilirim? Farklı bir parametre ile classifyAndWriteAnswers başka bir yöntem var ama dosyaya yazmak için hangi yazdığını bilmiyorum. Teşekkürler –

İlgili konular