BeautifulSoup innerhtml?

Diyelim ki div numaralı bir sayfam var. soup.find() ile kolayca div alabilirim.BeautifulSoup innerhtml?

Sonuç olarak, bu div'un WHOLE innerhtml'unu yazdırmak istiyorum: Demek istediğim, tam olarak ipucu gibi, TÜM html etiketleri ve tüm toegether'la bir dizeye ihtiyacım var obj.innerHTML ile javascript almak. Mümkün mü?

innerhtml = "".join([str(x) for x in div_element.contents])

kaynak

2011-11-13 Matteo Monti

biri böyle kullanımının bir şey olabilir. Belki biri dokümanları güncellemeli?

kaynak

2011-11-13 16:39:31 peewhy

unicode (x) –

daha güvenli olabilir, bu bir kaç başka sorunlar vardır. İlk olarak, dize öğeleri içinde html varlıklardan (büyük ve küçüktür) kaçmaz. İkincisi, yorum içeriğini değil, yorum etiketlerini yazacaktır. – ChrisD

Bunu @ChrisD yorumlarına kullanmamak için başka bir neden ekleme: Bu, ASCII olmayan karakterler içeren bir içeriğe UnicodeDecodeError atar. – Anthon

yaklaşır DOMs innerHTML method yapar belgelenmemiş işlevi yoktur: Bu, şimdiye kadar benim tüm test durumları geçti

def innerHTML(element): 
    return element.decode_contents(formatter="html")

seçenekten

kaynak

2013-09-03 22:04:31 ChrisD

Bu, bazı karakterleri HTML öğelerine dönüştürür. Gerçi varsayılan biçimlendirici ('None') ile iyi çalışıyor. – Tgr

Doğru cevap budur. @ peewhy'nin cevabı, ChrisD'nin ana hatlarıyla ifade ettiği nedenlerden dolayı işe yaramaz. – dbkaplun

, bu 'renderContents' için biraz farklı hatalarla yeniden adlandırıldı '(kodlama = DEFAULT_OUTPUT_ENCODING, prettyPrint = False, indentLevel = 0) ' – highvolt

Sadece unicode(x)? Benim için iş gibi görünüyor.

Düzeltme: Bu size dış HTML'yi verir ve içsel değil. Yalnızca metin (HTML etiketleri) gerekiyorsa

kaynak

2016-01-30 10:30:02

olarak yeniden adlandırıldı. Bu yalnızca içeriği değil, dış öğe de dahil olmak üzere div döndürecektir. – Arany

Haklısınız. Bunun için şimdi buradan ayrılmak, bu başka birine yardımcı olur. –

-1

, o zaman .text kullanabilirsiniz:

soup.select("div").text

kaynak

2017-11-18 10:21:16 Pikamander2

BeautifulSoup innerhtml?

cevap

İlgili konular