Bu, <p>
html etiketlerindeki içeriğin tamamını kaplayan beautifulsoup
yöntemidir. Bazı web sayfalarından içerik aldıktan sonra, maksimum yineleme derinliği aşıldı diyen bir hata alıyorum. Beautifulsoup, maksimum yineleme derinliğine ulaşıldı
def printText(tags):
for tag in tags:
if tag.__class__ == NavigableString:
print tag,
else:
printText(tag)
print ""
#loop over urls, send soup to printText procedure
izinin alt
:File "web_content.py", line 16, in printText
printText(tag)
File "web_content.py", line 16, in printText
printText(tag)
File "web_content.py", line 16, in printText
printText(tag)
File "web_content.py", line 16, in printText
printText(tag)
File "web_content.py", line 16, in printText
printText(tag)
File "web_content.py", line 13, in printText
if tag.__class__ == NavigableString:
RuntimeError: maximum recursion depth exceeded in cmp
Açıklar. Bu, önceki bir URL'den kaynaklanan bir örnek çıktıdır. " iki aylık bir süreç için kullanılan, şu anda beş günlük bir süreçtir. Dönüştürülebilir 1 ila 2 milyonluk sorun ..." Bu dizeleri içerir, ayrıca 1 uzunlukta dizeleri içerir . – yayu
Hangi bölümü anlamıyorsunuz, yineleyici mi yoksa yinelenen mi? Elbette, bu, kodun nasıl çalıştığını anlamanıza bağlıdır. –
"Dize vurduğun" ne anlama geldiğini açıklayabilir misin? Ne demek "vurmak"? Güzel Çorba tarafından başlangıçta bir dizeye dönüştürülen tüm HTML belgesi değil - ve bu etiketler kendilerini karakter dizeleri değil mi? Aynı hatayı, sadece 12 anchor içeren basit bir HTML sayfasına değerlerin yerini almaya çalıştık, ancak tetiklemenin ne olduğu açık değil. – Praxiteles