şuna benzer:javascript onclick ile bir bağlantıyı tıklatmak için scrub'dan CrawlSpider nasıl kullanılır?
<a href="#" onclick="return gotoPage('2');"> Next </a>
Bunun javascript kodu yorumlamak mümkün scrapy olacak mı? livehttpheaders Ben İleri tıklayarak böyle başlayan "çöp" gerçekten büyük bir parça ile bir POST üretir öğrendim uzatma ile
:
encoded_session_hidden_map=H4sIAAAAAAAAALWZXWwj1RXHJ9n
Ben CrawlSpider
sınıfa benim örümcek kurmaya çalışıyorum,
def logon(self, response):
login_form_data={ 'email': '[email protected]', 'password': 'mypass22', 'action': 'sign-in' }
return [FormRequest.from_response(response, formnumber=0, formdata=login_form_data, callback=self.submit_next)]
: ama gerçekten
BaseSpider
ile, bu kodu nasıl bilemiyorum ben bir POST yaptığı bir giriş formu, olur birinci URL'yi işlemek için
parse()
yöntemi kullanıldı
Sonra ne yapacağımı söylemek için submit_next() öğesini tanımladım. İlk URL'de hangi yöntemin kullanılacağını CrawlSpider'e nasıl anlarım?
İlk tarama dışındaki tüm istekler POST istekleridir. İki türden istekte bulunuyorlar: bazı verileri yapıştırıyor ve bir sonraki sayfaya gitmek için "İleri" yi tıklıyorlar. aşağıdaki gibi
Bana biraz daha içerik verin, scrub javascript'i yorumlayamaz ancak javascript'in gönderdiği POST mesajını (encoded_session_hidden_map) gizli form alanı olarak bulabilirseniz taklit edebilirsiniz. ya da başka birşey. – Joshkunz
PhantomJS'yi Deneyin. –