2012-09-16 23 views
5

Weka'da Öznitelik Seçimi yapmaya çalışıyorum. InfoGainAttributeEval'i bir değerlendirici olarak kullanmak isterim, çünkü bunun karşılıklı bilgiye eşdeğer olduğunu ve Ranker'ı bir arama yöntemi olarak okudum. Her iki eğitim ve test setine özellik seçimi yapmalı mıyım? Ayrıca, N parametresi için doğru değeri nasıl seçebilirim? tren ve test ayrı ayrı özellik seçimi uygulamakWeka Özellik Seçimi

teşekkürler kez bir sürü

Nadia

cevap

1

böylece onları uyumsuz hale farklı özelliklerin bir seçim neden olabilir. Bu nedenle, her iki kümenin de aynı özniteliklere sahip olduğundan emin olmak için, tüm veri kümenize özellik seçimi uygulamanız gerekir. En kullanışlı özellikleri seçtikten sonra verilerinizi bir tren ve test grubuna böldünüz.

Kullanılacak -N değerine gelince, toplam öznitelik miktarınızı kullanırdım. Bu, tüm özelliklerin sıralı bir listesiyle sonuçlanacak ve tüm özniteliklerin farklı puanlarını kendiniz değerlendirebilirsiniz. Daha sonra, hiçbir şey ekleyen özniteliklerden bir sınıflandırıcıyı eğitmek için herhangi bir yararlı bilgiyi tutan öznitelikleri ayıran net bir eşik belirtebilirsiniz. Daha sonra bu eşiği -T seçeneğini kullanarak ayarlayacağım.

+0

Hello @Sicco! Toplu filtreleme, eğitim ve test seti uyumlu hale getirmek için yönteminize eşdeğer olduğunu tahmin ediyorum. -N ve -T parametreleriyle ilgili önerileriniz, konuyu netleştirmeme yardımcı oldu ve bunları Weka'da denemek üzereyim. Bilgi için çok teşekkürler ve gecikmiş cevap için özür dilerim! – nadia

+0

özniteliklere bu şekilde uyum sağlamayacak mı? – fiacobelli

+0

@fiacobelli Eşiği ayarlamanın ne kadar sıkı olduğuna bağlı. Yalnızca en iyi performansa sahip bir öznitelik alır ve geri kalanını göz ardı ederseniz, gerçekten de uygun değildir. Önerilen tavsiyem, bazı ilginç verileri saklayan ve değerli bilgilerden yoksun olan özellikleri kaldıran birçok özelliği almaktı. Bunu cevabımda daha açık bir şekilde yaptım. – Sicco