Ben bir web sitesi ayrıştırmak ve BeautifulSoup.findAll ile biraz bilgi almaya çalışıyorum ama hepsini bulamaz .. ben python3Güzel Çorbası findAll kodu
kullanıyorum tüm bunları bulamazsa sadece bunların yarısı basar bu
#!/usr/bin/python3
from bs4 import BeautifulSoup
from urllib.request import urlopen
page = urlopen ("http://mangafox.me/directory/")
# print (page.read())
soup = BeautifulSoup (page.read())
manga_img = soup.findAll ('a', {'class' : 'manga_img'}, limit=None)
for manga in manga_img:
print (manga['href'])
... kırık HTML ile farklı
teşekkür! işe yaradı! :) – Clepto
Vay. Bu beni kafamı masaya vurmaktan kurtardı. Lxml ayrıştırıcısının sorun yaşadığını nasıl anladınız (sadece 18 satır döndürdüğü aşikardı). yani, bunun yanlış bir şekilde yanlış satır sayısına sahip olmasından başka bir sorun olduğunu nereden bilmeliydim? – FuriousGeorge
Deneyim; Çoğunlukla buradaki insanlara yardım ederek. –