Birkaç sütunda saklanan listeler içeren bir Pandalar DataFrame verildiğinde, her satır için en uzun listeyi içeren sütun adını bulmak için basit bir yol var mı? Bu verilerle ÖrneğinEn uzun listeyi içeren bir Pandalar DF'deki sütunun ismini bulun.
:
ben sıranın 1 ve "negatif" satır 2 ve 3.I için en uzun liste ile sütun olarak "olumlu" tanımlamak istediğiniz
positive negative neutral
1 [marvel, moral, bold, destiny] [] [view, should]
2 [beautiful] [complicated, need] []
3 [celebrate] [crippling, addiction] [big]
liste uzunluklarını hesaplamak için str.len()
kullanabileceğimi ve sütun adlarını almak için idmax()
kullanabileceğimi düşündüm, ancak bunların nasıl birleştirileceğini anlayamıyorum.
çok teşekkür ederiz! Hızlı takip: 'idxmax()', 'pozitif', 'negatif' ve 'nötr' tüm boş listeler olduğunda ilk endeksi (yani 'pozitif') döndürür. Bu çözüm, bu tür satırları yok saymak için değiştirilebilir mi? Boş listeleri NaN'lerle değiştirmeyi denedim, ancak 'len 'o zaman şikâyet ediyor:' '' float' 'nesnesinin nesnesi len()' 'değerine sahip değil. – user2950747
@ user2950747, tekrarlanabilir bir veri seti sağlayabilir misiniz? – MaxU
[bu örnek veri] (http://www.sharecsv.com/s/9dcf95cd39fa09eec291085eafecbd0c/polarity.csv) sondan üçüncü sırada boş listelere sahiptir ve "idxmax()" ile "pozitif" olarak etiketlenir. – user2950747