2015-08-06 13 views
5

Sahip olduğum LabeledPoint verilerine dayanan bir karar ağacı oluşturmak için Apache Spark Mllib 1.4.1'i (Spark'in python uygulaması) kullanıyorum. Ağaç düzgün üretir ve ben terminale yazdırmak kullanarak (Bu kullanıcının How to extract rules from decision tree spark MLlib deyimiyle kuralları ayıklamak) olabilir:Apache Spark'de (pyspark 1.4.1) bir karar ağacını nasıl görselleştirir/çizerim?

model = DecisionTree.trainClassifier(...) 
print(model.toDebugString() 

Ama ne yapmak istediğim için yazdırmadan yerine karar ağacını görselleştirmek veya çizmek olduğunu Durak. Pyspark'ta karar ağacını çizebileceğim herhangi bir yol var mı, yoksa karar ağacı verilerini kaydedebilir ve onu çizmek için R kullanabilir miyim? Teşekkürler!

+0

ben aynı şeyi yapmak gerekir. DT'nizi çizmeyi başardınız mı? – diplomaticguru

cevap

3

Karar Ağacı modeli Bu iki adımı bir JSON biçimine

  • Ayrıştırma Kıvılcım Karar Ağacı çıkışı vardır

    görselleştirme için bu proje Decision-Tree-Visualization-Spark yoktur.

  • JSON dosyasını, D3.js görselleştirmesi için bir girdi olarak kullanın. Bu biraz eski sonrası olsa ayrıştırıcı kontrol için

Dt.py

fonksiyonu def tree_json(tree) giriş sadece bu yüzden benim cevap vermek için, sizin modeller toDebugString()

Cevap question

0

dan Bundan sonra bu yazıya gelenlerin yararlanabileceği.

Alternatif olarak, PySpark'ta kullanım için "graphviz" python Paketini kullanabilirsiniz. Döngü yapısı varsa, karar ağacı modelini normalden ziyade düzgün bir ağaç yapısına basacaktır.

fazla detay bu linkte bulunabilir: https://pypi.python.org/pypi/graphviz

İlgili konular