Komut dosyası etiketlerini BeautifulSoup ile silebilir miyim?

Etiketleri ve tüm içeriklerini BeautifulSoup ile HTML'den kaldırılabilir mi, yoksa Normal İfadeleri mi kullanmalıyım yoksa başka bir şey mi kullanmalıyım?Komut dosyası etiketlerini BeautifulSoup ile silebilir miyim?

( official documentation) belirtildiği üzere

kaynak

2011-04-08 Sam

110

>>> from bs4 import BeautifulSoup 
>>> soup = BeautifulSoup('<script>a</script>baba<script>b</script>', 'lxml') 
>>> [s.extract() for s in soup('script')] 
>>> soup 
baba

kaynak

2011-04-08 17:31:11

Kaldırılacak ek etiketlere zincirlemenin en iyi yolu nedir? Şu anda, komutları birbiri ardına tekrarladığım zaman, [s.extract() 'da çorbada (' script ')] sonra [s.extract()' da çorbada ('iframe')] vb. ama ben onları (örneğin 'iframe', 'script')] için ss. – Ila

@Ali Çorbalarda [s.extract() için [[iframe ',' script ']) kullanmak zorundasınız.] 'Birden fazla etiket kullanmak için parametre –

@ FábioDiniz olmalıdır. Şöyle bir şey çıkardım: '' baba ''? Aynı mı? – user2883071

Aramayı eşleşen tüm alt ağacı kaldırmak için extract yöntemi kullanabilirsiniz.

import BeautifulSoup 
a = BeautifulSoup.BeautifulSoup("<html><body><script>aaa</script></body></html>") 
[x.extract() for x in a.findAll('script')]

kaynak

2011-04-08 17:33:44

ileride başvurmak üzere gerekebilir olanlar için cevap Güncelleme

: doğru cevaptır. decompose() Farklı yollar kullanabilirsiniz, ancak decompose yerinde çalışır.

Örnek kullanım:

soup = BeautifulSoup('<p>This is a slimy text and <i> I am slimer</i></p>') 
soup.i.decompose() 
print str(soup) 
#prints '<p>This is a slimy text and</p>'

Oldukça kullanışlı

böylece vb 'script', 'img' gibi döküntü kurtulmak için.

kaynak

2016-10-09 15:11:27 Vangel

'decompose' ile' extract' arasındaki fark, ikincisinin kaldırılan şeyi geri döndürmesidir, oysaki sadece onu yok eder. Yani bu soruna daha kesin bir cevaptır, ancak diğer yöntemler işe yarar. – Mike

Decompose, komut dosyası etiketlerinin içeriğini kaldırmaz, yalnızca etiketleri kaldırır. –

Hem yorumlarınızla hemfikirim. İşte bu yüzden OP'nin “kaldırılması” içeriğindeki doğru cevabı söyledim. Genellikle gereksiz etiketlerin ve biçimlendirmenin HTML'sini temizlemek için kullanılır. – Vangel

Komut dosyası etiketlerini BeautifulSoup ile silebilir miyim?

cevap

İlgili konular