Yinelenen satırları olan bir DataFrame'im var. Eşsiz bir dizin ve çoğaltmaları olmayan bir DataFrame almak istiyorum. Yinelenen değerleri atmak tamamdır. Mümkün mü? groupby
tarafından yapılmış mı?Pandalar: benzersiz veri çerçevesi
cevap
In [29]: df.drop_duplicates()
Out[29]:
b c
1 2 3
3 4 0
7 5 9
split-apply-combine dokümantasyon örneklerini okuyarak bunu yapmak için bir çıkış yolu düşündüm. veri alanları (b, c) etkili bir şekilde benzersiz olmasını istediğiniz vektör olarak satırın indeks parçası haline çoğaltıldığı burada satır indeksi dayanır
df = pandas.DataFrame({'b':[2,2,4,5], 'c': [3,3,0,9]}, index=[1,1,3,7])
df_unique = df.groupby(level=0).first()
df
b c
1 2 3
1 2 3
3 4 0
7 5 9
df_unique
b c
1 2 3
3 4 0
7 5 9
satırlar için çoğaltılan (yinelenmez). – hobs
Yinelenen dizin girişleriniz varsa, bu istediğiniz yanıttır. Bir MultIndex üzerinde unstack' 'yaparken Endeksi yinelenen girişler içeriyor, reshape' olamaz ama bu çözüm sadece ben' df_unique = df.groupby yapmak zorunda için çalışır (seviye = [0,1]): – rogueleaderr
Ben ValueError 'başlamıştı. first() ' – dashesy
- 1. Birden çok dosyadan pandalar veri çerçevesi oluşturma
- 2. MultiIndex ile Pandalar veri çerçevesi: dize
- 3. pandalar arsa histogram veri çerçevesi endeksi
- 4. Birden çok veri çerçevesi girdisine benzersiz bir tanımlayıcı nasıl atanır?
- 5. Her X satırı tarafından bin pandalar veri çerçevesi
- 6. Pandalar veri çerçevesi sütun A'yı topla B sütunu NaN (Python)
- 7. Pandalar Excel'de Veri Çerçevesi kaydedilirken dosya adına Zaman damgası ekleyin
- 8. Pandalar veri çerçevesi satırlarını, kategoriye göre sütunlara nasıl dönüştürür?
- 9. Pandalar: Sadece belirli sütunlardan yeni veri çerçevesi oluşturma
- 10. Pandalar çerçevesi altında en uzun dizeyle veri nasıl azaltılır?
- 11. Oturum anahtarı aracılığıyla istekler arasındaki pandalar veri çerçevesi nesnesine erişim
- 12. pandalar benzersiz değerler çoklu sütunlar
- 13. Python Pandalar: Tüm Sütunlar Üzerindeki Benzersiz Değerlerin Sıklığını Sayma
- 14. yeniden düzenleme Veri çerçevesi
- 15. Pandalar veri çerçevesinden JSON
- 16. Pandalar: yeniden şekillendirilmesi veri
- 17. Pandalar
- 18. Pandalar: ID'ye bölünmüş veri çerçevesi ve oluşturulan dosya adlarıyla csv'ye yaz.
- 19. Pandalar grubu veri çerçevesindeki işlemlere göre
- 20. Sıçrama yılını pandalar veri tabanından temizle
- 21. Veri çerçevesi veri tipini nasıl kullanır?
- 22. Varlık veri modeli, benzersiz dizin
- 23. Boole filtrelenmiş veri çerçevesi sütunlarının değerlerine değerlerin nasıl ayarlanacağı
- 24. Varlık çerçevesi: farklı veri tabanları
- 25. Veri çerçevesi ve tuple değerleri
- 26. Veri çerçevesi pythonunda boşluk kaldırma
- 27. Veri çerçevelerini pandalar çıkarırken NaN'ler
- 28. Pandalar: Bir groupby nesne sütununun ortasının bir eşiğin üzerinde olduğu satırların veri çerçevesi oluştur
- 29. Pandalar veri çerçevesi, test verilerinde aynı sütun adlarını seçmek için tren verilerinde sütun adlarını kullanır
- 30. bir pandalar dataframe
Bu, ya ilk ya da son meydana geldiği dikkate değer. Bu nedenle, önce başka bir miktara göre sıralama yapmalısınız (eğer şanslıysanız) ya da yine de karmaşık bir grup mantığı var. – ely
Bu yanlış. drop_duplicates yalnızca değerler üzerinde çalışır (en azından benim sürümümde). İndeks ve değerlere düşmek isterseniz veya indeksle çalışmak istiyorsanız, index_index'i sıfırlamanız gerekir. Belki de grup endeksinin benzersiz endeksi uygulamak için başka bir yolu var mı? – mathtick
Yeni bir değişken atamak istemiyorsanız, 'df.drop_duplicates (inplace = True)' seçeneğini kullanın. –