2012-10-09 14 views
5

Weka'daki ağırlıklar ile ilgili yardımınıza ihtiyacım var. Büyük ölçekli veriler üzerinde bazı denemeler yapıyorum: Verileri örneklere çeviriyorum ve çalışmak için farklı sınıflandırıcılar kullanıyorum. Şimdi, örneklere erişim hakkı vermenin çalışmayı nasıl etkilediğini incelemek istiyorum - bazen bir örneği ağırlığa sahip olmak istiyorum ve bazen değil. Benim sorum şu ki:Weka'da ağırlıklar nasıl kullanılır?

  1. Mümkün olan ağırlıkların aralığı nedir?
  2. Ağırlığın etkisi sınıflandırıcıdan sınıflandırıcıya farklılık gösteriyor mu?
  3. Varsayılan bir ağırlık var mı (1 tane olabileceğini gördüm ama güvenceye almak istiyorum)?
  4. ilgili bilgilere herhangi bir referans mutluluk duyacağız :)

cevap

7

cevap 2. soruya "evet", ve bu da Temelde 1. soruya cevap etkiler, Weka yalnızca gerçek üzerine ağırlıklar geçer sınıflandırma algoritması. İzin verilen ağırlık aralığı ve bunların nasıl kullanıldığı, tamamen sınıflandırıcının uygulanmasına bağlıdır. Soru 3 ile ilgili olarak, varsayılan ağırlık tüm örneklere eşit ağırlık verecektir, gerçek sayı bu kadar önemli değildir. Örneğin, en yakın komşu sınıflandırıcısı, ağırlık değerlerini mutlu bir şekilde alacak olsa bile, ağırlıkları tamamen yok sayar. Teorik olarak, en yakın komşu sınıflandırıcılar ağırlıkları dikkate almak için uygulanabilirdi, ama bu özel değil. Dolayısıyla, 2. soruya verilen cevap, aslında sınıflandırıcının, sınıflandırıcı algoritmasından çok daha fazla uygulanmasına bağlı olmasıdır.

1

aşağıdaki içeriğe sahip bir XRFF dosyası oluşturmak:

<dataset name="Weka" version="3.7.13-SNAPSHOT"> 
    <header> 
     <attributes> 
     <attribute name="Nombre" type="nominal"> 
      <labels> 
       <label>Alcohol</label> 
       <label>Opioides</label> 
       <label>Cannabinoides</label> 
       <label>Benzodiacepinas</label> 
       <label>Cocaina</label> 
       <label>Anfetaminas_y_derivados</label> 
      </labels> 
      <metadata> 
        <property name="weight">0.2</property> 
      </metadata> 
     </attribute> 
     <attribute name="Tendencia_a_discutir" type="nominal"> 
      <labels> 
       <label>No</label> 
       <label>Yes</label> 
      </labels> 
      <metadata> 
        <property name="weight">0.5</property> 
      </metadata> 
     </attribute> 
     <attribute name="Agresion" type="nominal"> 
      <labels> 
       <label>No</label> 
       <label>Yes</label> 
      </labels> 
      <metadata> 
        <property name="weight">0.5</property> 
      </metadata> 
     </attribute> 
. 
. 
. 
     <instance> 
      <value>Anfetaminas_y_derivados</value> 
      <value>Yes</value> 
      <value>Yes</value> 
      <value>Yes</value> 
      <value>No</value> 
      <value>No</value> 
      <value>Yes</value> 
      <value>No</value> 
      <value>No</value> 
      <value>No</value> 
      <value>No</value> 
      <value>Yes</value> 
      <value>No</value> 
      <value>No</value> 
      <value>No</value> 
      <value>No</value> 
      <value>Yes</value> 
      <value>Yes</value> 
      <value>No</value> 
      <value>No</value> 
      <value>Yes</value> 
      <value>No</value> 
      <value>No</value> 
      <value>Yes</value> 
      <value>Yes</value> 
      <value>Yes</value> 
      <value>Yes</value> 
      <value>No</value> 
      <value>No</value> 
      <value>No</value> 
      <value>No</value> 
      <value>No</value> 
      <value>No</value> 
      <value>No</value> 
      <value>No</value> 
      <value>No</value> 
      <value>No</value> 
      <value>No</value> 
      <value>No</value> 
      <value>Yes</value> 
      <value>No</value> 
      <value>Yes</value> 
      <value>Yes</value> 
      <value>Yes</value> 
      <value>Yes</value> 
      <value>Yes</value> 
      <value>Yes</value> 
      <value>Yes</value> 
      <value>Yes</value> 
      <value>Yes</value> 
      <value>Yes</value> 
      <value>Yes</value> 
     </instance> 
     </instances> 
    </body> 
</dataset> 

Ama NaivesBayes uyguladığınızda Weka ağırlıkları kullanıp kullanmadığını görebiliyorum. Aşağıdakiler, ağırlıkları kullanmak için algoritmanın AttributeSelectedClassifier kodunu değiştirmelerini önermektedir.

İlgili konular