2016-08-11 33 views
6

Çok büyük pandalar veri karememe sahibim, 1000 satırlık bir tablo olan html tablosuna yani dataframe.to_html() dönüştürüyorum. Sayfa sırasını kullanmanın kolay bir yolu, böylece 1000 satırın tamamını kaydırmam gerekmeyecek. Söyleyin, ilk 50 satırı görüntüleyin ve ardından sonraki 50 satırı görmek için ileri 'yi tıklayın.Pandalar üzerinde sayfalandırma dataframe.to_html()

+0

Gerçekten de bir soru soran soru! CSS sınıfları kullanılarak "sayfalandırma" gerçekleştirilebiliyorsa, koşullu olarak [Stil] (http://pandas.pydata.org/pandas-docs/stable/style.html) kullanmayı deneyebilirsiniz (örn. 0-49 satır) : sayfa1, 50-99 - Stil: sayfa2, vb.). – MaxU

+0

Bir Jupyter defterinde mi yoksa bağımsız bir HTML dosyası olarak mı görüntülemeye çalışıyorsunuz? – Shovalt

cevap

0

Düşünebildiğim en iyi çözüm, birkaç tane harici JS kitaplığı içerir: JQuery ve onun DataTables plugin. Bu çok az çaba ile sayfalamadan çok daha fazlasını mümkün kılacaktır.

Biraz HTML, JS ve piton kuralım:

from tempfile import NamedTemporaryFile 
import webbrowser 

base_html = """ 
<!doctype html> 
<html><head> 
<meta http-equiv="Content-type" content="text/html; charset=utf-8"> 
<script type="text/javascript" src="https://ajax.googleapis.com/ajax/libs/jquery/2.2.2/jquery.min.js"></script> 
<link rel="stylesheet" type="text/css" href="https://cdn.datatables.net/1.10.16/css/jquery.dataTables.css"> 
<script type="text/javascript" src="https://cdn.datatables.net/1.10.16/js/jquery.dataTables.js"></script> 
</head><body>%s<script type="text/javascript">$(document).ready(function(){$('table').DataTable({ 
    "pageLength": 50 
});});</script> 
</body></html> 
""" 

def df_html(df): 
    """HTML table with pagination and other goodies""" 
    df_html = df.to_html() 
    return base_html % df_html 

def df_window(df): 
    """Open dataframe in browser window using a temporary file""" 
    with NamedTemporaryFile(delete=False, suffix='.html') as f: 
     f.write(df_html(df)) 
    webbrowser.open(f.name) 

Simdi bunu test etmek için bir örnek veri kümesi yükleyebilirsiniz:

from sklearn.datasets import load_iris 
import pandas as pd 

iris = load_iris() 
df = pd.DataFrame(iris.data, columns=iris.feature_names) 

df_window(df) 

güzel sonucu: enter image description here

Bir kaç not:

  • base_html dizesindeki pageLength parametresine dikkat edin. Bu, sayfa başına varsayılan satır sayısını tanımladığım yer. Diğer isteğe bağlı parametreleri DataTable options page'da bulabilirsiniz.
  • df_window işlevi bir Jupyter Defterinde test edildi, ancak düz python'da da çalışmalıdır.
  • df_window'u atlayabilir ve döndürülen değeri df_html'dan bir HTML dosyasına yazabilirsiniz.