'da doğruluk oranını azaltır. Bazı veriler hakkında bilgi edinmek için sklearn kullanıyorum. Bu bir ikili sınıflandırma görevidir ve bir RBF çekirdeği kullanıyorum. Veri setim oldukça dengesiz (80:20) ve sadece 120 örnek kullanıyorum, 10ish özellikleriyle (birkaç tane daha az deney yapıyordum). class_weight="auto"
'u ayarladığımdan, çapraz doğrulanmış (10 kat) bir gridsearch'dan hesapladığım doğruluk oranı önemli ölçüde düştü. Niye ya??Veri setini dengelemek için sınıf ağırlığını kullanmak, RBF SVM
Farkı göstermek için birkaç doğrulama doğruluğu ısı haritası ekleyeceğim.
NOT: classweight otomatik olarak değiştirildi önce üst ısı haritası olduğunu.
Gerçek pozitif oranı kontrol etmenin yanı sıra, tam performansı analiz etmenin yanı sıra sınıfın ağırlığını değiştirmeden önce (en iyisi) sınıftaki azınlık grubundakilerin 5 veya 6'sını aldım. Ancak değiştirdikten sonra birden fazla almak için – bidby