Bir pandalar veri kümesinden bir eğitim ve test seti yapmaya çalışıyorum. Ben çalıştırdığınızda: Ben olsunSklearn StratifiedShuffleSplit pandalarla
df.event.value_counts()
:
irrelevant 5030
event 394
Ancak bu ı çalıştırdığınızda çünkü böyle değildir
ValueError: The least populated class in y has only 1 member, which is too few. The minimum number of labels for any class cannot be less than 2.
:
sss = StratifiedShuffleSplit(df['event'], n_iter=3, test_size=0.2)
hatası alıyorum
Bu konuya ne sebep olabilecek herhangi bir fikrin var mı?
Uyarılarınızı yeniden üretemezsiniz. Meraktan, len (df) 'nedir? –
5424. Sadece tamamen farklı bir csv ile çalıştı ve iyi çalışıyor, sorun neden bu df hakkında ne olduğundan emin değilim. – GNMO11
CSV'de boş bir satır gibi görünüyor Neden – GNMO11