2016-04-05 21 views
1

7 özellik ve yaklaşık 1 milyon satır veya kayıt içeren veri kümeme bir Rasgele Orman Sınıflandırıcı ekledim.Rastgele Orman Sınıflandırıcı tahmininde Bellek hatası

Benim kodum aşağıdadır.

randForestClassifier=RandomForestClassifier(n_estimators=10,max_depth=3) 
randForestClassifier.fit(X_train,y) 
pred=randForestClassifier.predict(featues_test) 

Sınıflandırıcımın tahmin yöntemini kullandığımda Bellek hatası alıyorum. Nasıl düzeltebilirim? Yığın izleme gösterdiği gibi Evet, alıyorsanız MemoryErrorrandForestClassifier.predict(featues_test) de, ardından

benim tam günlük

randForestClassifier.predict(featues_test) 
Traceback (most recent call last): 

    File "<ipython-input-15-0b7612d6e958>", line 1, in <module> 
    randForestClassifier.predict(featues_test) 

    File "C:\Python27\lib\site-packages\sklearn\ensemble\forest.py", line 462, in predict 
    proba = self.predict_proba(X) 

    File "C:\Python27\lib\site-packages\sklearn\ensemble\forest.py", line 513, in predict_proba 
    for e in self.estimators_) 

    File "C:\Python27\lib\site-packages\sklearn\externals\joblib\parallel.py", line 659, in __call__ 
    self.dispatch(function, args, kwargs) 

    File "C:\Python27\lib\site-packages\sklearn\externals\joblib\parallel.py", line 406, in dispatch 
    job = ImmediateApply(func, args, kwargs) 

    File "C:\Python27\lib\site-packages\sklearn\externals\joblib\parallel.py", line 140, in __init__ 
    self.results = func(*args, **kwargs) 

    File "C:\Python27\lib\site-packages\sklearn\ensemble\forest.py", line 106, in _parallel_helper 
    return getattr(obj, methodname)(*args, **kwargs) 

    File "C:\Python27\lib\site-packages\sklearn\tree\tree.py", line 592, in predict_proba 
    proba = self.tree_.predict(X) 

    File "sklearn/tree/_tree.pyx", line 3207, in sklearn.tree._tree.Tree.predict (sklearn\tree\_tree.c:24468) 

    File "sklearn/tree/_tree.pyx", line 3209, in sklearn.tree._tree.Tree.predict (sklearn\tree\_tree.c:24340) 

MemoryError 

cevap

0

geçerli:

File "<ipython-input-15-0b7612d6e958>", line 1, in <module> 
    randForestClassifier.predict(featues_test) 

yığın izlemesi kalan hatlar

gösteriyor problemler sklearn, C kodu: sklearn\tree\_tree.c:24340

+1

dan geliyor ...... ama çıkış yolu nedir? düzelt. –

+1

1 milyondan az satır itmeyi denediniz mi? Bellek boyutuna ve bir satırın boyutuna bağlı olarak, yüksek bellek boyutuna kolayca erişebilirsiniz. Bir satır bellekte 1000 bayt ise, RAM'de depolamak için 10 GB veri alırsınız. – aluriak

+0

10000 satır diledim ve mükemmel çalıştı ........ ama şimdi bu tam veriler, bu 1 milyon satırdan ne haber? –

İlgili konular