2016-04-14 32 views
1

here'dan doktorların isimleriyle ilişkili tüm bağlantıları bulmaya çalışıyorum. Sanırım XPath'ımda bir sorun var ama emin değilim.Python lxml web kazıma: xpath çalışmıyor

from lxml import html 
import requests 

    page = requests.get('http://www.cpsnl.ca/default.asp?adv=1&com=DoctorSearch&selComm=&txtFName=&Certification_Code_Desc=&txtLName=&NameHidden=all&offset=0') 
    tree = html.fromstring(page.content) 


    links = tree.xpath('//*[@id="main_con"]/table/tbody/tr/td/a') 
    print(links) 

cevap

0

istekleri sizin için indirmek istiyorum HTML tbody eleman var olmazdı. tbody, genellikle bir tarayıcı oluşturan bir şeydir. Sabit XPath ifadesi (buna ek olarak href işaret eder):

//*[@id="main_con"]/table//tr/td/a/@href