Güzel Çorba modülünü kullanarak, sınıf adı feeditemcontent cxfeeditemcontent
olan div
etiketinin verilerini nasıl edinebilirim? HTML kaynakGüzel Çorba Kullanarak sınıf adı ve içeriği alın
soup.find_all('class')
Bu edilir:
soup.class['feeditemcontent cxfeeditemcontent']
ya: Öyle mi
<div class="feeditemcontent cxfeeditemcontent">
<div class="feeditembodyandfooter">
<div class="feeditembody">
<span>The actual data is some where here</span>
</div>
</div>
</div>
ve bu Python kodu:
from BeautifulSoup import BeautifulSoup
html_doc = open('home.jsp.html', 'r')
soup = BeautifulSoup(html_doc)
class="feeditemcontent cxfeeditemcontent"
'classes = dict (tag.attrs) .get ('class', '')' 'try'' except' bloğundan çok daha kısadır ve işlevselliği aynıdır. –
@DoronCohen 'dict()' gerekli mi? Olmadan çalışmak görünüyor. – Mark
@Mark "dict()" olmadan bir istisna alıyorum çünkü bu bir 'TypeError listesidir: liste indisleri str değil, tamsayı olmalıdır. Ayrıca, bu cevap Güzel Çorba 3'ü (neden farklı sonuçlar gördüğünüz olabilir) olduğunu varsayarsa, muhtemelen 4 numaralı sürümü kullanmalı ve diğer cevabı kullanmalısınız. – jadkik94