pandas
, DataFrame
'u html table
'a dönüştürmek için to_html()
kullanışlı bir sayfa sağlar. DataFrame
'a geri okumak için kullanışlı bir işlev var mı? mümkün değildir genel durumdaBir html tablosunu pandalar veri çerçevesine dönüştürmek için
10
A
cevap
7
0,12
3
ancak yaklaşık sizin tablonun yapısını biliyorsanız böyle bir şey olabilir:
# Create a test df:
>>> df = DataFrame(np.random.rand(4,5), columns = list('abcde'))
>>> df
a b c d e
0 0.675006 0.230464 0.386991 0.422778 0.657711
1 0.250519 0.184570 0.470301 0.811388 0.762004
2 0.363777 0.715686 0.272506 0.124069 0.045023
3 0.657702 0.783069 0.473232 0.592722 0.855030
Şimdi html ayrıştırmak ve yeniden:
from pyquery import PyQuery as pq
d = pq(df.to_html())
columns = d('thead tr').eq(0).text().split()
n_rows = len(d('tbody tr'))
values = np.array(d('tbody tr td').text().split(), dtype=float).reshape(n_rows, len(columns))
>>> DataFrame(values, columns=columns)
a b c d e
0 0.675006 0.230464 0.386991 0.422778 0.657711
1 0.250519 0.184570 0.470301 0.811388 0.762004
2 0.363777 0.715686 0.272506 0.124069 0.045023
3 0.657702 0.783069 0.473232 0.592722 0.855030
You Gerekirse, MultiIDx dfs veya eval()
kullanarak otomatik tip algılama için genişletebilir.
İlgili konular
- 1. Pandalar birleştirme/birleştirme/iki veri çerçevesine uydurma
- 2. grup tarafından bir pandalar veri çerçevesine sahip başka bir sütun
- 3. Bir dizenin tüm oluşumlarını pandalar veri çerçevesine (Python) değiştirin
- 4. Pandalarda bir veri çerçevesine aynı anahtar sözcükleri ekleme
- 5. Sözlük anahtarlarına göre pandalar veri çerçevesine sütunlar nasıl eklenir?
- 6. Nasıl C# ile Html için Görüntü Veri URI dönüştürmek için?
- 7. html tablosunu javascript dizgesine dönüştürün
- 8. HTML Tablosunu Excel'e Aktar
- 9. Bir Html tablosunu veritabamına dönüştürmenin en iyi yolu nedir
- 10. html tablosunu Excel'e dışa aktarmak için Javascript
- 11. Veri tablosunu seçme VBA
- 12. Ben basit veri çerçevesine sahip bir
- 13. Döngüyü değiştirin Veri çerçevesine uygula
- 14. Tablo html tablosunu PDF'ye nasıl aktarabilirsiniz?
- 15. Her veri çerçevesine bir işlev uygulayın
- 16. Python: Zaman çizelgesini bir veri çerçevesine dönüştürün
- 17. igraph nesnesini bir veri çerçevesine dönüştürün R
- 18. Veri çerçevesine sıralı sütun ekleme
- 19. Ortak Lisp'de bir HTML tablosunu kazıma?
- 20. Bir veri çerçevesine indekslenirken NA'ları "yoksaymak" için R'yi nasıl tetiklersiniz?
- 21. HTML tablosunu web görünümünde görüntüleme
- 22. Pandalar veri çerçevesinden JSON
- 23. html çerçevesine dailymotion kanalı ekle (video değil)
- 24. Pandalar: yeniden şekillendirilmesi veri
- 25. Sürekli pandalar veri çerçevesini seyrek veri çerçevesinden doldurma
- 26. Nasıl html tablo birden çok sayfaya excel dönüştürmek için?
- 27. Varsayılan değerle veri çerçevesine sütun ekle
- 28. pandalar için matlab veri dosyası DataFrame
- 29. Pandalar: benzersiz veri çerçevesi
- 30. foreach paketini kullanarak veri çerçevesine satır ekler
Sanmıyorum, ama 'dan küçük bir yardımla çok zor olmamalı lxml' ... – root
Ayrıca html'' dönüşüm kayıplı olan pandalar yayımlanan read_html yarar gibi Yazım bilgileri kaybolur, böylece kendiniz belirtmeniz gerekir. Her neyse, eğer 'df' nispeten basitse (örneğin tek tip veri türleri), dönüşüm sadece birkaç satırlık kod almalıdır. – root
pandalar, bu sorunu hafifletmeye çalışan bazı tür çıkarım yöntemlerine sahiptir ve oldukça iyi bir iş çıkarırlar. –