2016-04-08 17 views
0

Veri kümemde iki sınıf var. İlgisiz biri% 90, ilgi alanı ise% 10'dur.Sınıflandırma Tek bir sınıfta hassas Optimizasyon?

Yeniden örneklemeyi zaten bir kez değil, dengeli kümelerden oluşan bir grup (örneğin 10 set) yaptım. Ve son tahmin sonuçlarını almak için çoğunluk oyu verin. Birçok modeli karşılaştırdıktan sonra, ağaç en iyi sonucu verir. Ve önem derecelerine göre en önemli özellikleri seçtim.

Genel doğruluk fena değil,% 75, ancak ilgilendiğim sınıfa karşı hassasiyet sadece% 30'dur, bu da iyi değildir. Hedef sınıfın hassaslığına yönelik optimizasyon nasıl yapılır? R'deki ctree paketinin arkasındaki algoritmalar, genel doğruluğa yönelik optimizasyon yapmak olduğunu düşünüyorum. Ayrıca svm gibi tek sınıflı bir sınıflandırmayı denedim, ama iyi değil. Btw, her iki r ve python kullanılır. Ama benim sorunumla ilgili hiçbir paket bulamadım. İlgilenen sınıfın hassasiyetini optimize edecek kendi ağaç algoritmamı yazmam gerekir mi? Teşekkürler.

cevap

0

ağırlık sınıfları için size yeteneği veren birçok model vardır. Bu, genel olarak nesneyi doğrudan değiştirdiğinden çok fazla örneklemeden iyidir, yapay olarak modeli aşırı kilolu hale getirmez. Eğer python kullanırsanız ve ağaç tabanlı bir yaklaşım kullanıyorsanız, scikit-learning'deki Random Forest sınıf-ağırlık yeteneklerine sahiptir, ancak istenen hassasiyet elde edilemediği sürece azınlık sınıfınızı fazla kilolu hale getirin.

+0

Fakat genel olarak, ağırlık sınıfları yeniden örnekleme ile aynı şeyi yapıyor mu? Bu yüzden, aşırı örnekleme adımını atlayın, dengesiz veri kümemdeki modeli doğrudan oluşturun ve ağırlıkları ekleyin? –

+0

Hayır, eğilmede yeniden örnekleme ve ağırlığı destekleyen modeller için kullanılmamalıdır. Benzerler ama aynı değiller. Farklı örnekleme, ağırlıklandırmanın yaklaşımıdır, ancak yalnızca yaklaşık değerlerdir. Temel formda aşırı örnekleme aynı zamanda (özellikle bazı interaktif metotlar için) kabaca yaklaşık olarak yaklaşır ve bazı aşırı örnekleyiciler suni örneklerin tanıtımıyla daha fazlasını yaparlar. – lejlot