kullanarak HTML Ayrıştırma. İşteNeyi yanlış yapıyorum? Ben LXML kullanarak bir web sayfası ayrıştırmak çalışıyorum ve ben bir div içindeki tüm metin öğeleri geri getirmeye çalışıyor sorun yaşıyorum LXML
Şu an itibariyleimport requests
from lxml import html
page = requests.get("https://www.goodeggs.com/sfbay/missionheirloom/seasonal-chicken-stew-16oz/53c68de974e06f020000073f",verify=False)
tree = html.fromstring(page.text)
foo = tree.xpath('//section[@class="product-description"]/div[@class="description-body"]/text()')
"foo" boş bir liste [] geri getiriyor ... Ben bugüne kadar ne var. Diğer sayfalar, bazı içeriği geri getirir, ancak 'un içinde bulunan etiketlerin tümünü içermez. Diğer sayfalar, tüm içeriği geri getirir, çünkü div'un en üst düzeyindedir.
Bunu nasıl div içindeki metin içeriğinin her geri getirebilirim? Teşekkürler!
Evet, bu tam olarak neye ihtiyacım olduğunu! Teşekkürler. // text() yöntemi çalışır, ancak listedeki öğeleri almak benim kullanım durumum için çalışmaz. – jrubins