PANDAS'lı read_csv
kullanırken, bozuk değer soruna değeri hakkında bir gösterge olmadan, tüm operasyon kesecektir.Pandalar ile bir CSV'den gelen tamsayıları okurken NaN'nin değerine nasıl nazikçe geri dönüş yapılır? ı, belirli bir sütun türü dönüştürülebilir istiyorum
import pandas as pd
import numpy as np
df = pd.read_csv('my.csv', dtype={ 'my_column': np.int64 })
hata ile biten bir yığın izleme ile sonuçlanacak mı: Böyle bir şey çalıştıran Örneğin
i satır numarasını veya hatalı kusurlu değeri olsaydı
ValueError: cannot safely convert passed user dtype of <i8 for object dtyped data in column ...
ileti, bilinen NaN
değerleri listesine ekleyebilirim, ancak bu şekilde yapabileceğim hiçbir şey yok.
arızaları göz ardı ederek bu durumda bir np.nan
dönmek için ayrıştırıcı anlamanın bir yolu var mı?
Mesaj Scriptum: Tuhaftır, her türlü öneri olmadan (hiçbir dtype
argüman) ayrıştırma sonra d['my_column'].value_counts()
serisi için gerçek dtype
başarısız olur jenerik object
olmasına rağmen dtype
hakkını anlaması ve doğru otomatik np.nan
koymak gibi görünüyor
sadece 'read_csv' tahmin daha iyi olduğunu ancak bu d_type NaN'' temsil edilemez 'olarak float64' – EdChum
mu int64' 'value_counts' olur bazı değerini gösteren' olacağı anlamına gelecektir gibi 'na_values' ancak göründüğü bir numaraya dönüştürülebilir değil mi? (bu yüzden 'object' dtype') – joris
sayesinde, yorumlarınız beni cevap olarak gönderdiğim çözüme götürdü. – danza