Okumak için kullanmam gereken bir dizi sekme ayrılmış dosyam var, bunları pandalar veri kartı olarak kullan, onlarla ilgili bir sürü işlem yap ve sonra bunları bir excel dosyasına birleştir, kod ben ayrıştırma ediyorum oanahtar hatası ve MultiIndex lexsort derinliği
sekme dosyalarının sorunlu kısmı geçmesi için gidiyorum bu yüzden çok uzun sıralar
ben tarafından indeksliyorum bu dosyaları okumak 2.177 hepsi aynı sayıda içerir türünün ilk 2 sütun (ip, int)
df = df.set_index(['id', 'coord'])
data = OrderedDict()
#data will contain all the information I am writing to excel
data[filename_id] = df
bir o İhtiyaçlarım yapıyorum prosedürleri f ('id' olmanın bu
sample_row = data[sample].ix[index]
benim indeksi gibi, sütunlar 'id' ve 'coord' ile endeksli karışık türlerinden dataframe içeren veri [sample_id] her satıra erişmek ,) 'coord'
her şey iyi çalışıyor dosyasının bir alt kümesini tedavi, ama ben 2177 çizgilerle tüm dosyaları okursanız ben SO aradık bu hata mesajınıKeyError: 'Key length (2) was greater than MultiIndex lexsort depth (0)'
sahip sonunda ise
ve her yerde ve bu, endeksi sıralamanın bir sorunu gibi görünüyor, ama neden bizi anlamıyorum Sıralanmamış bir altkümenin girilmemesi, sorunun neden ortaya çıkmamasına dair bir fikre neden olmaz?
Teşekkür
Teşekkür ederim Jeff, bunu biliyorum ve dokümanı okudum ama sorun şu ki, sadece garip bulduğum 1000 satırdan büyük veri ağı için oluyor! – Rad
Sadece sort_index() – Rad
yaparak sorunumu çözdüm Dokümanlar için bu özel bağlantıya artık bir bağlantı yoksa, bu [http://pandas.pydata.org/pandas-docs/ adresinden yararlanabilirsiniz. Bunun yerine kararlı/indexing.html # etiketlerle dilimleme). – Akronix