Beautifulsoup = Bir etiketin içindeki içeriği çıkar

"Hello world" adlı içeriği ayıklamak istiyorum. Sayfada <table> ve benzeri <td colspan="2"> katları olduğunu lütfen unutmayın. Beautifulsoup = Bir etiketin içindeki içeriği çıkar

i aşağıdaki çalıştı:

hello = soup.find(text='Name: ') 
hello.findPreviousSiblings

Ama hiçbir şey geri döndü. Aşağıdaki çıkarma "My ev adresi" ile

<table border="0" cellspacing="2" width="800"> 
<tr> 
<td colspan="2"><b>Name: </b>Hello world</td> 
</tr> 
<tr>

Buna ek olarak, ben de yaşıyorum sorun:

<td><b>Address:</b></td> 

<td>My home address</td>

Ben de kullanıyorum İşte

kod bloğu var = "Adres:" metnini aramak için aynı yöntem ancak sonraki satıra nasıl gidebilirim ve <td> içeriğini nasıl alabilirim? Bir sonraki

kaynak

2011-05-14 ready

kullanımı yerine

>>> s = '<table border="0" cellspacing="2" width="800"><tr><td colspan="2"><b>Name: </b>Hello world</td></tr><tr>' 
>>> soup = BeautifulSoup(s) 
>>> hello = soup.find(text='Name: ') 
>>> hello.next 
u'Hello world'

sonraki ve önceki kardeş yöntemleri ayrıştırma ağacının

kaynak

2011-05-14 02:26:53

Hiçbir şey döndürür. hello = soup.find (text = 'Name:') hello.next – ready

'Name:' belgedeki başka bir yerde görünüyor mu? –

Üzgünüz, bu benim hatamdı. Şimdi çalışıyor. – ready

ile çalışırken onlar çözümleyici tarafından işlenmiştir sırayla belge öğeleri arasında hareket edelim contents operatörü text ürününü <tag>text</tag>'dan ayıklamak için iyi çalışıyor.

<td>My home address</td> örnek:

s = '<td>My home address</td>' 
soup = BeautifulSoup(s) 
td = soup.find('td') #<td>My home address</td> 
td.contents #My home address

<td><b>Address:</b></td> örnek:

s = '<td><b>Address:</b></td>' 
soup = BeautifulSoup(s) 
td = soup.find('td').find('b') #<b>Address:</b> 
td.contents #Address:

kaynak

2013-01-09 18:21:05 solvingPuzzles

Beautifulsoup = Bir etiketin içindeki içeriği çıkar

cevap

İlgili konular