Örneğin ben bir site vardı "www.example.com"
Aslında bu sitenin html yerel sisteme kaydederek kazımak istiyorum. böylece test için iyerel sistemde kaydedilen html ile dosyayı kazıyarak
class ExampleSpider(BaseSpider):
name = "example"
start_urls = ["example.html"]
def parse(self, response):
print response
hxs = HtmlXPathSelector(response)
aşağıda bunun için örümcek kodu yazmıştı example.html
Şimdi
olarak benim masaüstünde o sayfayı kurtardı Ama ben
aşağıdaki gibi bu hatayı alıyorum Yukarıdaki kodu çalıştırdığınızdaValueError: Missing scheme in request url: example.html
Son olarak benim intension benim yerel sisteme
kaydedilenwww.example.com
html kodu oluşur
example.html
dosyayı kazımak için
herhangi biri, örneğin github için scrapy Talebinin kaynak kodunu görüntülemek lütfen önceden
Sabit diskinize kaydedilecek HTTP Önbellek ara katmanını etkinleştirebilirsiniz. Temel olarak, HTTP Önbellek ara katman yazılımı için ayarladığınız zaman aşımına bağlı olarak önceki bir kazı işlemini tekrarlayabilirsiniz. –
@Sjaak Trekhaak: Cevabınız için teşekkürler, bana bir örnek verebilir, böylece daha yararlı –
emin değilim, ama deneyebilirsiniz: 'start_urls = [" file: /// home/local/cname/username/project/scrapy_project_modules/example/exampl e.html "]' – warvariuc