2011-07-13 17 views
5

original Wordnet search'a bakarsanız ve "Görüntüleme seçenekleri: Lexical Dosya Bilgilerini Göster" i seçerseniz, sözcük dosyası sözcüklerinin son derece yararlı bir sınıflandırmasını görürsünüz. Örneğin, "doldurmak" için:Wordnet'te "sözcük dosyası" nasıl bulunur?

<noun.substance>S: (n) filling, fill (any material that fills a space or container) 
    <noun.process>S: (n) filling (flow into something (as a container)) 
    <noun.food>S: (n) filling (a food mixture used to fill pastry or sandwiches etc.) 
    <noun.artifact>S: (n) woof, weft, filling, pick (the yarn woven across the warp yarn in weaving) 
    <noun.artifact>S: (n) filling ((dentistry) a dental appliance consisting of ...) 
    <noun.act>S: (n) filling (the act of filling something) 

Köşeli parantez içindeki ilk şey "sözcük dosyası" dır. Ne yazık ki iki şey için bu bilgileri The

  • WordNet 3,0 puan latest RDF translation sağlayan bir SPARQL uç noktasını bulmak mümkün olmamıştır:

  • Talis SPARQL endpoint. Böyle bilgi yok kontrol etmek için bu sorguda örneğin kullanın:

    DESCRIBE <http://purl.org/vocabularies/princeton/wn30/synset-chair-noun-1>

  • W3C's mapping description. Ek D "Dönüşüm ayrıntıları", yararlı bir şeyi açıklar: wn:classifiedByTopic. Ancak sözcük dosyası ile aynı değildir ve oldukça eksiktir. Bir kamu vardır: soru

    <j.1:classifiedByTopic rdf:resource="http://purl.org/vocabularies/princeton/wn30/synset-American_football-noun-1"/>

> - "tamamlanma" nin duyusundan biri konuyla ilgili "Amerikan Futbolu"

DESCRIBE <http://purl.org/vocabularies/princeton/wn30/synset-completion-noun-1> iken Örn "sandalye", ilgisi WordNet sorgu API veya sözcük dosyası bilgi sağlayan bir veritabanı nedir?

cevap

1

O WordNet sorgulamak için MİT JWI (MIT Java WordNet Arayüzü) bir Java API üzerinden yapılabilir. erişmek için bir java sınıfı nasıl uygulanacağı gösteren this link bir konu var lexicographic

Synset[] synsets = database.getSynsets(wordStr); 

ReferenceSynset referenceSynset = (ReferenceSynset) synsets[i]; 

int lexicalCode =referenceSynset.getLexicalFileNumber(); 

Ardından, tablonun üst kullanmak

"lexnames" örneğin anlamak için

+0

WordNet Supersenses (sözlüğü sözcükleri) –

3

Bunu WordNet'in RDF/OWL Temsili bölümünde bulabileceğinizi sanmıyorum. Ancak, WordNet dağıtımında: dict/lexnames. İşte WordNet 3.0 itibariyle dosyanın içeriği:.

00  adj.all 3 
01  adj.pert  3 
02  adv.all 4 
03  noun.Tops  1 
04  noun.act  1 
05  noun.animal  1 
06  noun.artifact 1 
07  noun.attribute 1 
08  noun.body  1 
09  noun.cognition 1 
10  noun.communication  1 
11  noun.event  1 
12  noun.feeling 1 
13  noun.food  1 
14  noun.group  1 
15  noun.location 1 
16  noun.motive  1 
17  noun.object  1 
18  noun.person  1 
19  noun.phenomenon 1 
20  noun.plant  1 
21  noun.possession 1 
22  noun.process 1 
23  noun.quantity 1 
24  noun.relation 1 
25  noun.shape  1 
26  noun.state  1 
27  noun.substance 1 
28  noun.time  1 
29  verb.body  2 
30  verb.change  2 
31  verb.cognition 2 
32  verb.communication  2 
33  verb.competition  2 
34  verb.consumption  2 
35  verb.contact 2 
36  verb.creation 2 
37  verb.emotion 2 
38  verb.motion  2 
39  verb.perception 2 
40  verb.possession 2 
41  verb.social  2 
42  verb.stative 2 
43  verb.weather 2 
44  adj.ppl 3 

dict/her veri girişi için *, ikinci sayı sözcük dosya bilgisi olduğunu. Örneğin, bu doldurma girdisi, noun.food olan 13 sayısını içerir.

07883031 13 n 01 filling 0 002 @ 07882497 n 0000 ~ 07883156 n 0000 | a food mixture used to fill pastry or sandwiches etc. 
1

Bu benim için çalıştı budur, noun.time

1

Python NLTK arabirimini kullanma: önerisini describer Ciaramita ve Johnson ve Ciaramita ve Altun ait iki yayın, web üzerinde arama, bu lexicographics ilgileniyorsanız, BTW

from nltk.corpus import wordnet as wn 

for synset in wn.synsets('can'): 
    print synset.lexname 
İlgili konular