2015-04-25 18 views
6

pandalar Yanlış aşağıda aşağıdadır:Farklı read_csv index_col = Yok/0/I read_csv komutu kullanılır

In [20]: 
    dataframe = pd.read_csv('D:/UserInterest/output/ENFP_0719/Bookmark.csv', index_col=None) 
    dataframe.head() 
    Out[20]: 
    Unnamed: 0 timestamp url visits 
    0 0 1.404028e+09 http://m.blog.naver.com/PostView.nhn?blogId=mi... 2 
    1 1 1.404028e+09 http://m.facebook.com/l.php?u=http%3A%2F%2Fblo... 1 
    2 2 1.404028e+09 market://details?id=com.kakao.story 1 
    3 3 1.404028e+09 https://story-api.kakao.com/upgrade/install 4 
    4 4 1.403889e+09 http://m.cafe.daum.net/WorldcupLove/Knj/173424... 1 

sonuç sütunu Unnamed:0 gösterir ve ben index_col=False kullanıldığında bu simillar, ama index_col=0, kullanıldığında sonuç aşağıda takip ediyor:

dataframe = pd.read_csv('D:/UserInterest/output/ENFP_0719/Bookmark.csv', index_col=0) 
dataframe.head() 
Out[21]: 
timestamp url visits 
0 1.404028e+09 http://m.blog.naver.com/PostView.nhn?blogId=mi... 2 
1 1.404028e+09 http://m.facebook.com/l.php?u=http%3A%2F%2Fblo... 1 
2 1.404028e+09 market://details?id=com.kakao.story 1 
3 1.404028e+09 https://story-api.kakao.com/upgrade/install 4 
4 1.403889e+09 http://m.cafe.daum.net/WorldcupLove/Knj/173424... 1 

sonuç sütunu Unnamed:0 göstermek yaptım burada ben sormak istiyorum, aralarında index_col=None, index_col=0 ve 01.230.948 fark nedir, this belgelerini okudum, ancak hala bu fikri almadım.

+0

Sana 'unamed olsun nedeni düşünüyorum: İlk csv çünkü 0' olduğunu satır şöyle: ', zaman damgası, url ziyareti' dizin sütunu boş – EdChum

cevap

6

bu belirsizlik insanların

ORİJİNAL

bir sürü önlemek için index_col için bir boole geçmeye çalışması durumunda artık bir hata yükseltecek Ben sürümü 0.16.1 beri düşünüyorum

GÜNCELLEME Bu konuda kafanızın ordinal endeksini belirtmek için şaşkın olsun, bu durumda int pozisyonunu geçmelisiniz 0 o indeks sütunu False'u geçer, bu yüzden None'u geçmelidir. False, gözlemlediğiniz sonucu 0'a göre değerlendirecektir. Yukarıda gösterildiği gibi,

In [3]: 

import io 
import pandas as pd 
t="""index,a,b 
0,hello,pandas""" 
pd.read_csv(io.StringIO(t)) 
​ 
Out[3]: 
    index  a  b 
0  0 hello pandas 

varsayılan değer index_col=None olup. Biz index_col=False geçerseniz

In [4]: 

pd.read_csv(io.StringIO(t), index_col=0) 
Out[4]: 
      a  b 
index    
0  hello pandas 

biz nedeniyle False için yukarıdaki gibi aynı sonucu elde 0 için değerlendirilmesi:

biz açıkça endeks olarak ilk sütunu tedavi etmek belirten ediyoruz index_col=0 ayarlarsanız

: biz şimdi index_col=None devlet varsa
In [5]: 

pd.read_csv(io.StringIO(t), index_col=False) 
Out[5]: 
    index  a  b 
0  0 hello pandas 

biz bu param geçemedi zaman aynı davranışı elde

In [6]: 

pd.read_csv(io.StringIO(t), index_col=None) 
Out[6]: 
    index  a  b 
0  0 hello pandas 

boş indeks sütunu var durum için DÜZENLEME

ne varsa hangi:

In [7]: 

import io 
import pandas as pd 
t=""",a,b 
0,hello,pandas""" 
pd.read_csv(io.StringIO(t)) 
​ 
Out[7]: 
    Unnamed: 0  a  b 
0   0 hello pandas 
In [8]: 

pd.read_csv(io.StringIO(t), index_col=0) 
Out[8]: 
     a  b 
0 hello pandas 
In [9]: 

pd.read_csv(io.StringIO(t), index_col=False) 
Out[9]: 
    Unnamed: 0  a  b 
0   0 hello pandas 
In [10]: 

pd.read_csv(io.StringIO(t), index_col=None) 
Out[10]: 
    Unnamed: 0  a  b 
0   0 hello pandas 
İlgili konular