Makine öğrenmeye yeni başlıyorum ve karar ağaçları ile deney yapıyorum. Bir karar ağacının bu görselleştirmesine http://scikit-learn.org/dev/_images/iris.svg bakıyorum ve hata değerinin ne anlama geldiğini merak ediyorum. Gini Endeksi mi yoksa Bilgi kazancı mı? Sezgisel olarak ne anlama geldiğini de takdir ediyorum.Scikit Decistion Ağacı Görselleştirme: hata değerinin anlamı
cevap
Bu somut örnekte, bir düğümün "hatası", bu düğüme ulaşan tüm örneklerin Gini Dizini'dir. Genel olarak, bir düğümün "hatası", beton katışkı kriterine (örneğin, sınıflandırma için gini veya entropisi ve regresyon için ortalama karesel hataya) bağlıdır.
Sezgisel olarak, çoklu ayarın ne kadar homojen olduğunu ölçmek için hem safsızlık kriterlerini (gini ve entropi) düşünebilirsiniz. Çoğunlukla tek tipte elemanlar içeriyorsa (bu "saf" olarak da adlandırılırsa, "safsızlık kriteri" olarak adlandırılır), bir çok set homojendir. Bizim örneğimizde, çoklu kümenin öğeleri, karşılık gelen düğüme ulaşan sınıf etiketleridir. Bir düğümü ikiye böldüğümüzde, ortaya çıkan bölümlerin saf olmasını isteriz - yani sınıfların iyi bir şekilde ayrıldığı anlamına gelir (bir bölüm çoğunlukla bir sınıfın örneklerini içerir).
criterion="entropy"
ve ikili sınıflandırmada 1.0 hatası, düğümde eşit sayıda pozitif ve negatif örnek bulunduğunu gösterir (en homojen çoklu set).
Sen uzantı türü sklearn.tree._tree.Tree
ait nesne üzerinde bir tutar onun tree_
niteliği yoluyla DecisionTreeClassifier
veya DecisionTreeRegressor
temelini ağaç veri yapısını erişebilir. Bu nesne, bir dizi paralel numol dizisi olarak ağacı temsil eder. init_error
dizisi, her düğümün başlangıç hatasını tutar; Düğüm bir düğüm düğümüyse, best_error
iki bölümün hatalarının toplamını tutar. Daha fazla ayrıntı için https://github.com/scikit-learn/scikit-learn/blob/master/sklearn/tree/_tree.pyx#L45 sınıf belgelerine bakın.
- 1. ObjectSpace.count_objects'deki her bir hash değerinin anlamı nedir?
- 2. Dinamik görselleştirme bokeh
- 3. "Hizalama tuzağı" hata iletisindeki öğelerin anlamı nedir?
- 4. XSD Görselleştirme?
- 5. Graphx Görselleştirme
- 6. STRING değerinin ağaçlandırma sırası ağaç
- 7. ko.observable değerinin değiştirilmesi
- 8. Scala değerinin java
- 9. scikit-learn'in MLPRegressor
- 10. Python'un scikit-öğrenmesinde ağaç derinliğine nasıl erişiyorsunuz?
- 11. Bir karar ağacının görselleştirilmesi (örnek: scikit-öğrenmesi)
- 12. İkili ifadesi Ağacı
- 13. C# ses görselleştirme
- 14. Veri görselleştirme kütüphanesi
- 15. görselleştirme yosys çıktı kullanıyorum
- 16. Algoritma görselleştirme nasıl yapılır?
- 17. Kibana görselleştirme - Nagios
- 18. Python modülünün yapısını görselleştirme
- 19. C# yöntemi mantığını görselleştirme
- 20. Google Görselleştirme ColumnChart
- 21. Grafik Boyama Görselleştirme
- 22. Grafik görselleştirme aracı
- 23. Corrupted git ağacı?
- 24. Makro değerinin tanımlanması
- 25. Bir öğenin değerinin
- 26. Yalnızca card.column değerinin angular2
- 27. Bir NSNumber değerinin değiştirilmesi
- 28. Yönlendirenin değerinin değiştirilmesi
- 29. scikit-learn GridSearchCV best_score_ nasıl hesaplanır?
- 30. küme noktaları (scikit öğrenmek)
Sezgisel anlam basittir: bu düğüme kadar ağaca geçiş yaparsanız gerçek sınıflandırma hatası için bir proxy, daha sonra önerdiği öneriyi yapın (görünüşte resimde gösterilmiyor ...). –