Sınıfta bir dengesizlik problemim var ve scikit-learn (> = 0.16) ile uygulamayı kullanarak ağırlıklı bir Rasgele Ormanı denedim.scikit-learn: Rastgele orman class_weight ve sample_weight parametreleri
ben uygulama sınıfı dengesizliği çözmeye yardımcı olmak için bir ağaç yapıcı içinde class_weight parametreyi ve formda yöntemde sample_weight parametre alır fark etmiş. Son iki kiloya karar vermek için bu ikisi çarpılır gibi görünüyor.
sorun anlamakta güçlük şu: bu ağırlıklar kullanılır ne ağaç inşaat/eğitim/tahmin aşamaları ise
- ? Ağırlıklı ağaçlar için bazı kağıtlar gördüm, ama scikit'in uyguladığıdan emin değilim.
- Sınıf_yükü ile sample_weight arasındaki fark tam olarak nedir?
Temel sınıflandırıcı olarak DT hakkında haklısınız. Ayrıca, bu ağırlıkların eğitim sırasında nasıl kullanıldığına (örneğin, bir karar düğümünde kirliliğe karar verme vb.) Ve öngörme sırasında da ilgileniyorum. – user36047
"fit()" yöntemi altındaki "sample_weight" belgesine bakın: [Decision tree API] (http://scikit-learn.org/stable/modules/generated/sklearn.tree.DecisionTreeClassifier.html#sklearn. tree.DecisionTreeClassifier) – Andreus
Her ne kadar kristal net olmasa da, ben malzemelerin linklerini sindirdiğimde her şeyin daha net olacağını düşünüyorum :) – user36047