Ana soru: Python ve scikit-learn'deki farklı randomForestleri nasıl birleştiririm?scikit-learn kullanarak rasgele ormanların paralel üretimi
Halihazırda, esnek harita azaltma özelliğini kullanarak rastgele en hızlı nesneler oluşturmak için R içindeki randomForest paketini kullanıyorum. Bu bir sınıflandırma problemini ele almaktır.
Giriş verilerim bir makinede belleğe sığamayacak kadar büyük olduğundan, verileri daha küçük veri kümelerine örnekleyerek daha küçük bir ağaç kümesi içeren rasgele orman nesnesi oluşturuyorum. Sonra yeni bir rasgele orman nesnesi oluşturmak için değiştirilmiş bir birleştirme işlevi kullanarak farklı ağaçları birleştiririm. Bu rastgele orman nesnesi, özellik önemini ve ağaçların son kümesini içerir. Bu, oob hataları veya ağaçların oylarını içermez.
Bu, R'de iyi bir performans gösterirken, scikit-learn kullanarak Python'da da aynı şeyi yapmak istiyorum. Farklı rastgele orman nesneleri oluşturabilirim, ancak yeni bir nesne oluşturmak için bunları birleştirmenin bir yolu yok. Herkes beni ormanları birleştirebilecek bir işleve işaret edebilir mi? Bu scikit-learn kullanarak mümkün mü?
Bu işlemde, R: Combining random forests built with different training sets in R numaralı makalede anlatılan bir soruyu içeren bir bağlantı bulunmaktadır.
Düzenleme: Oluşan rasgele orman nesnesi, tahmin için kullanılabilecek ağaçları ve ayrıca özelliği önemle içermelidir.
Herhangi bir yardım için teşekkür ederiz.
ise o zaman hiçbir zorunluluk yoktur Farklı modelleri birleştirmek için. Ayrı modellerle ön denetim yapabilir ve daha sonra sonuçları birleştirebilirsiniz. – DrDom
@DrDom ile katılıyorum, modellerin bir araya getirilmesinin birçok yolu vardır. Nasıl yapmak istediğinize dair detaylar oldukça önemlidir. – David
@DrDom Sadece tahminler olsaydı sonuçları birleştirebileceğimi kabul ediyorum. Ancak, sadece tahminler değil, aynı zamanda özelliklerin değişken önemi ile ilgileniyorum. – reddy