Scikit dbscan algoritmasını çalıştırırken Bellek Hatası aldım. Verilerim yaklaşık 20000 * 10000, ikili bir matris.Scikit-öğrenmede DBSCAN seyrek matris kullanabilir mi?
(Belki. Ben makine öğrenme acemiyim böyle bir matris ile DBSCAN kullanmak uygun değildir. Ben sadece bir başlangıç küme numarası gerekmez küme yöntemi bulmak istiyorum) neyse
Ben seyrek matris ve scikit özellik çıkarma bulundu.
http://scikit-learn.org/dev/modules/feature_extraction.html http://docs.scipy.org/doc/scipy/reference/sparse.html
Ama yine nasıl kullanılacağını bilmiyorsunuz. DBSCAN'ın spesifikasyonunda, seyrek matris kullanımı hakkında bir gösterge yoktur. İzin verilmiyor mu?
DBSCAN'da seyrek matrisin nasıl kullanılacağını bilen varsa, lütfen bana bildirin. Ya da bana daha uygun bir küme yöntemi söyleyebilirsin.
Olası yinelenen [scikit-öğrenme DBSCAN bellek kullanımını] (http://stackoverflow.com/questions/16381577/scikit-learn-dbscan-memory-usage) –