Ben şuna benzer muazzam dosyaları var:Hız geliştirme datetime indeksi ile read_csv
05/31/2012,15: 30: 00.029,1306.25,1, E, 0, 1306,25
05/31/2012,15: 30: verimli etmek
pd.read_csv(gzip.open("myfile.gz"), header=None,names=
["date","time","price","size","type","zero","empty","last"], parse_dates=[[0,1]])
mi var herhangi bir şekilde: 00.029,1306.25,8, E, 0, 1306,25
kolayca aşağıdaki kullanarak bunları okuyabilir Böyle tarihler pandalar zaman damgaları içine ayrıştırır? Değilse, date_parser = 'a geçebilecek bir cython işlevi yazmak için herhangi bir kılavuz var mı?
Kendi çözümleyici işlevimi yazmayı denedim ve üzerinde çalıştığım proje için hala çok uzun sürüyor. ([ "Tarihi"] değerlere df, df [ "zaman"] değerleri..)
zaman damgaları = convert_date_cython: pythonçağrı:
Yani read_csv işlevi ayrıştırma ihtiyaçlarını karşılayan ama çok yavaş? – BKay
Evet, aslında. Kolay bir çözüm yoksa, birisinin bunu cython'da ele almak için kılavuzluk edip edemeyeceğini görmek istedim. –
"pd.Timestamp" ın çalışmadığı (örneğin pd.Timestamp ('05 /31/2012,15:30:00.029 ') 'ile birlikte) bunu karıştırıyor. Olmadığı gerçeği büyük ihtimalle bir böcek. –