2013-09-05 13 views
9

Ben WordNet'in içinde benzerlik ölçüsünü hesaplamak için Wu ve Palmer yöntemi kullanmak istiyorsanız, lcssynset1 arasında "en küçük ortak subsumer" ve synset2"En az kullanılan alt kuruluş" nedir ve nasıl hesaplanır?

Benim sorum ise

wp = (2 X depth(lcs))/(depth(synset1) + depth(synset2)) 

geçerli:

  1. "En az kullanılan alt kısım" nedir?
  2. Nasıl hesaplanır?
+0

kullanabilirsiniz

Perl, sen, paketi nltk kullanabilirsiniz Python WordNet::Similarity package

kullanabilir? Ve sizce bu görevi gerçekleştirmek için gereken dosyalar nelerdir? – justhalf

+0

Bunu bilmek isterim, "en az kullanılan ortak" nedir? –

+1

Yani sorunuz şu: "En az yaygın olanı nedir?". Bu durumda bunu açıkça belirtmelisiniz ve bundan sonra bunu nasıl hesaplayacağınızı soruyorsunuz. – justhalf

cevap

15

bu paper göre, Asgari Ortak iki kavram A Subsumer ve B kavramı ağaç is-a denklem ile ifade edilir, "hem A ve B bir atası en özel konsept" dir. Bir kavram, diğer kavramın, büyükanne ve büyüklerin ebeveynleri olan insan aile ağacındaki atayı tanımladığınız yol gibi, diğer kavramların atası olarak tanımlanır. Örneğin:

  1. Bir araba bir otomobil olduğunu ve bir otomobil Bir tekne bir aracın bir araç
  2. olduğunu.
  3. Araç bir nesnedir.

Ve grafiği: "Araç" "otomobil" bir atası ise bu durumda

 
    Object 
     | 
    Vehicle 
     | 
    --------- 
    |  | 
Boat Automobile 
      | 
     Car 

, "otomobil", ebeveyn "otomobil" (ve aynı zamanda atası) 'dir. "Araç" da "tekne" nin bir atasıdır. Bu durumda, "tekne" ve "araba" nın LCS'si "araç" tır, çünkü hem "tekne" hem de "araba" nın atası olan en özel kavramdır. "Nesne" nin hem "tekne" hem de "araba" nın ortak bir üyesi olmasına rağmen, en az değil, çünkü hala "nesne" olan bir çocuk (bu durumda "araç") olduğu ve aynı zamanda ortak olan hem "araba" hem de "bot" un bir parçası. "Otomobil", "tekne" nin bir atası olmadığından, en az kullanılan ortak değildir.

Benzerlik ölçüsünü hesaplamak için, kullanılabilir kitaplığı kullanmanızı öneririm, aksi takdirde kavram grafiğini kendiniz oluşturmanız gerekir; bu da zahmetlidir. Özellikle, Java'da wup_similarity

, size denedi Ne ws4j package

+0

Cevabınız için teşekkürler, şimdi LCS'nin (Tekne, Araba) derinliğinin ne olduğunu bilmek istiyorum?3 ya da 4 mü? –

+2

Ağacı hakkında daha fazla bilgi almanızı öneririm (http://en.wikipedia.org/wiki/Tree_(data_structure)). Temel olarak derinlik ağacın kökünden hesaplanır. Grafiğimi kullanarak, kök 'Nesne'dir. Yani, Nesne'nin derinliği 0'dır. Şimdi, “LCS (Tekne, Araba)' Araç ”dır, yani derinlik 1'dir. – justhalf

+0

" En özel kavram "olmalıdır, bu yüzden en aşağı, hala 'Araç' – justhalf

İlgili konular