varsayalım ben yapıyla iç içe bir sözlük 'user_dict' var:Construct pandalar DataFrame
Seviye 1: KullanıcıNo (Uzun Tamsayı)
Seviye 2: Kategori (String)
Seviye 3: Çeşitli özellikler (mantarlar, int, vs ..)
Örneğin, Bu sözlüğün giriş olacaktır:
user_dict[12] = {
"Category 1": {"att_1": 1,
"att_2": "whatever"},
"Category 2": {"att_1": 23,
"att_2": "another"}}
"user_dict" her öğe aynı yapıya sahiptir ve "user_dict" dan serisi inşa, bir pandalar DataFrame beslemek istediğiniz öğelerin çok sayıda içerir Öznitellikler. Bu durumda, bir hiyerarşik endeks amaç için yararlı olacaktır.
Özellikle, benim sorum DataFrame yapıcı serisi sözlükte "düzey 3" değerlerinden inşa edilmesi gerektiğini anlamalarına yardımcı olmak için bir yol olup olmadığıdır? Ben endeks olarak kullanıcı kimliklerini sahip (ne elde etmek istediğinizi tersi olan sütun olarak alınır (kullanıcı kimliği yıllardan) "düzey 1" deki
df = pandas.DataFrame(users_summary)
öğeler:
ben gibi bir şey denerseniz).
Ben sözlüğe giriş yineleme sonra dizi inşa biliyorum, ama daha doğrudan bir yol olup olmadığını bu çok yararlı olacaktır. Benzer bir soru, bir dosyada listelenen json nesnelerine ait bir panda DataFrame oluşturmanın mümkün olup olmadığını sormaktı.
Bu, keyfi derinlikli dağınık listelerle çalışmak için genelleştirmenin makul bir yolu var mı? Örneğin. Bazı dalların diğerlerinden daha kısa olabildiği keyfi bir derinliğe kadar listeler ve daha kısa dallar sona ermediğinde bir Yok veya nan kullanılır? – naught101
Pandalar json desteğine (io tools) ve normalizasyona baktınız mı? http://pandas.pydata.org/pandas-docs/dev/io.html#normalization –
Hayatımı kurtarın !!!!!!!!!! Çok şey öğrenin! teşekkür ederim – Wen