Her zaman olduğu gibi, sık sık sorunlarım var ve mevcut soruya tam olarak cevap aradım ancak kendimi bir kayıpta buldum. - How to fix httplib.BadStatusLine exception? - Python httplib2 Handling Exceptions - python http status codehttplib.BadStatusLine: ''
Sorunum şudur : İşte aramış yerlerden bazılarıdır. Bir örümcek yarattım ve farklı urlleri taramak istiyorum. Her URL'yi bağımsız olarak taradığımda her şey iyi çalışıyor. Ancak, her ikisini de taramaya çalıştığımda, aşağıdaki hatayı alıyorum: httplib.BadStatusLine: ''
Okuduğum bazı önerileri okudum (bkz. Yukarıda belirtilen bağlantılar) ve her istek çalışması için response.status yazdırabilirsiniz, ancak response.url yazdırmıyor ve hata atılıyor. (Sadece hatanın kaynağını tanımlamaya çalışmak için her iki ifadeyi de basıyorum).
Umarım bu açıktır. Ben scrapy ve selenyum kullanıyorum
class PeoplePage(Spider):
name = "peopleProfile"
allowed_domains = ["blah.com"]
handle_httpstatus_list = [200, 404]
start_urls = [
"url1",
"url2"
]
def __init__(self):
self.driver = webdriver.Firefox()
def parse(self, response):
print response.status
print '???????????????????????????????????'
if response.status == 200:
self.driver.implicitly_wait(5)
self.driver.get(response.url)
print response.url
print '!!!!!!!!!!!!!!!!!!!!'
# DO STUFF
self.driver.close()
Teşekkür ederim Nima. Sanırım ana sorun oturumu kapatıyor olsaydı ... Tekrar teşekkürler! :-) –