cnpj num_doc bc_icms
0 02817342000124 0000010154 17827.07
1 54921580000189 0000112428 108000.00
2 08953538000122 0000012865 232.00
3 08953538000122 0000012865 239.00
4 08953538000122 0000012865 215.00
5 07374346000107 0000014224 320.12
6 07374346000107 0000014231 385.04
7 07374346000107 0000014263 401.28
8 07374346000107 0000014279 391.26
9 02364118000124 0000015263 37353.10
10 02364118000124 0000015264 56214.14
df1.dtypes
çıktısı:
: Yani
cnpj object num_doc object bc_icms float64 dtype: object
.... ben şu soruyu cevaplamak için bir özet tablo oluşturmak çalışıyorum her
cnpj
içinbc_icms
arasındasum
nedir?indexes = [np.array(df1['cnpj']), np.array(df1['num_doc'])] pt1 = pd.DataFrame(df1['bc_icms'], index=indexes) print pt1
Ve burada çıkış var:
Bu benim yazdığım şey bu
bc_icms
02817342000124 0000010154 NaN
54921580000189 0000112428 NaN
08953538000122 0000012865 NaN
0000012865 NaN
0000012865 NaN
07374346000107 0000014224 NaN
0000014231 NaN
0000014263 NaN
0000014279 NaN
02364118000124 0000015263 NaN
0000015264 NaN
0000015265 NaN
07720786000160 0000020128 NaN
Bu istediğim pivot tablo yapısı olduğunu düşünüyorum! İyi! Ama ...
nasıl bu NaN en düzeltebilirim?
Nasıl her CNPJ'sinden için bir "toplam" çizgi oluşturabilir? Excel'de
Örnek:
ben "aggfunc" kullanmak gerektiğini düşünüyorum ama bilmiyorum .. . henüz .. –