Veri kümemde çok sayıda benzersiz değere (nesne tipi) sahip bir sütun var. Bazılarının önemsiz olduğuna inanıyorum (eğer yedeklerse) ve bu yüzden belirli bir eşiğin altındaysa seviyeleri gruplamak istiyorum. Sütunu etiket kodlayıcı modülü ile kategorik değerlere dönüştürdüm, sonra belirtilen bir eşikten daha az bir sayıya sahip olan bu kategorileri birleştirmek istiyorum. Bu yüzden, hazırladığım bu örnek kümesi için, 'bin' sütunundaki belirli bir sınıfa ait toplam sayı (frek), 2 yerine eşit veya daha azsa, bunun yerine 'o' 'new_bins' sütununun altında yeni bir değer alır. . Böylece bin ('c', 'd') 'new' lerde 'o' olarak değiştirilecektir.python benzer kategorik değerleri gruplandırıyor
id | bin | new_bins
======== =================
1 a a
2 a a
3 b b
4 c o
5 b b
6 a a
7 b b
8 a a
9 c o
10 a a
11 d o
12 d o
df.groupby(['bin'], sort=True).count())
Bu, denediğim bir kod satırı ancak istediğimi gerçekleştirmiyor. Kodum olmadığı için bu biraz bulanık bir şey olduğunu biliyorum. Bu meselenin çöp kutularına atıfta bulunduğunu düşündüm ama belki de başka bir şey deniyor, benzer bir örneği cezalandıramayacağım. Kaggle yarışmalarında birleşme seviyeleri olarak adlandırıldı. Belki de sadece aramam gereken terim veya cümlenin isimlendirilmesi de yardımcı olacaktır.
çalışması gerektiği gibi görünüyor. Seni haberdar ederim. – OAK