1
Bir web sitesi kazımak için BeautifulSoup kullanıyorum. Bağlantıyı döndürdüğünde /watch/411012/1/test.html
olarak geliyor - nasıl yapabilirim http://website.co.uk/watch/411012/1/test.html dönecek?BeautifulSoup web kazıma
from bs4 import BeautifulSoup
import urllib2
import re
resp = urllib2.urlopen("http://website.co.uk") #add more sites
soup = BeautifulSoup(resp, from_encoding=resp.info().getparam('charset'))
for link in soup.find_all('a', href=re.compile('sports')):
print link['href']
ben bu tek komut olduğu gibi birden fazla site için yapabileceği nasıl. –
@AlexMcbatman iyi, base_url, - '' http://website.co.uk ''adresine gittiğiniz site olacaktır. Eğer zorluklarla karşılaşırsanız ayrı bir soru oluşturmak mantıklı gelebilir. Teşekkürler. – alecxe