scikit lineer regresörü kullanarak pandalar veri karesinde basit bir doğrusal regresyon yapmaya çalışıyorum. Benim veriler zaman serisi ve pandalar veri çerçevesi bir datetime indeksine sahiptir: basit bir şey yapıyorKullanım Scikit Bir zaman serisi pandaları veri karesinde doğrusal regresyon yapmayı öğrenin
value
2007-01-01 0.771305
2007-02-01 0.256628
2008-01-01 0.670920
2008-02-01 0.098047
olarak
from sklearn import linear_model
lr = linear_model.LinearRegression()
lr(data.index, data['value'])
işe yaramadı:
float() argument must be a string or a number
yüzden çalıştı dönüştürmek için tarihlerle yeni bir sütun oluşturmak için
ama şimdi olsun:
ValueError: Input contains NaN, infinity or a value too large for dtype('float64').
Yani regresör datetime işleyemez. Tamsayı verisini datetime dönüştürmek için bir sürü yol gördüm, ancak örneğin datetime'dan tamsayıya dönüştürmenin bir yolunu bulamadım.
Bunu yapmanın doğru yolu nedir?
PS: Scikit kullanmak istiyorum çünkü daha sonra onunla daha fazla şey yapmayı planlıyorum, şu an için hiçbir istatistik modeli yok.
Tarihinizi zaman aşımına dönüştürün: http://stackoverflow.com/questions/15203623/convert-pandas-datetimeindex-to-unix-time – mbatchkarov
Teşekkürler. Aşağıdaki çözüm daha "pandonik" dir. – Ivan
Aynı arzu burada. Ben sklearn'in bir datetimeindex ile başa çıkamayacağı konusunda üzgünüm ... Keşke bilim topluluğunun birlikte daha iyi oynamasını diliyorum. –