dayalı değeri olan bir sütun ekleyin ve ben çözemediğiniz bir sorunla karşı karşıyayımpandalar - ... exisitng biri (bidonları, qcut) yavaşça</strong> + <strong>pandalar</strong><strong>piton R</strong><strong>hareket ediyorum
Bir sütundaki değerleri, kutulara atayarak ve bu ikili adları ile bir sütunu özgün DataFrame
'a ekleyerek ayırmam gerekiyor. pandas.qcut
kullanmayı deniyorum, ancak ortaya çıkan Categorical
nesnesi, DataFrame
ile iyi çalışmıyor gibi görünüyor.
import pandas as pd
df1 = pd.DataFrame(np.random.randn(10), columns=['a'])
df1['binned_a'] = pd.qcut(df1['a'],4)
Ben yeni bir sütun göremiyorum df1
üzerinde describe
çağırmak için çalışıyor: Ancak
>>> df1.describe()
a
count 10.000000
mean 0.594072
std 1.109981
min -0.807307
25% -0.304550
50% 0.545839
75% 1.189487
max 2.851922
, görünüşe göre vardır:
>>> df1
a binned_a
0 0.190015 (-0.305, 0.546]
1 0.140227 (-0.305, 0.546]
2 1.380000 (1.189, 2.852]
3 -0.522530 [-0.807, -0.305]
4 -0.452810 [-0.807, -0.305]
5 2.851922 (1.189, 2.852]
6 -0.807307 [-0.807, -0.305]
7 0.901663 (0.546, 1.189]
8 1.010334 (0.546, 1.189]
9 1.249205 (1.189, 2.852]
Neyi yanlış yapıyorum? İstenilen sonuç, kutularını tanımlayan 4 benzersiz dize değeri olan bir sütun elde etmektir (R'deki gibi).
DÜZENLEME:
olarak doğru Dan tarafından fark, salt metin verilerinin bulunduğu sütun ve böylece gizemli sorun çözüldü :) Çok teşekkürler göstermez summary()
yöntemi!
Tam olarak değil, tamamen categoricals önlemek görmek için ben df1 ['binned_a'] = pd.Series (pd.qcut (df1 ['a'], 4)) 'yi denemeyi denedim ve hala sonuç yok ... –
'binned_a''daki" biblolar "dizgilerdir Yani '' define() '' onları görmezden gelir. Tam olarak bidonları anlatmak ister miydin? –
Ahhh, gerçekten ... Bir sütun 'define()' de gösterilmediğinde, o zaman bir şey yanlış (R metin sütunları da summry'de gösterilir) ... Şimdi açık gibi görünüyor, düşündüm çok! –