node.js.'de kapsamlı ekran kazıma kullanan bir web uygulamasını bir araya getirme sürecindeyim. Her köşede akıntıya karşı savaştığımı hissediyorum. Bunu yapmanın daha kolay bir yolu olmalı. En önemlisi, iki şey rahatsız edici şunlardır:node.js'de ekran kazıma işleminin en zarif yolu nedir?
Kurabiye yayılım. 'Set-cookie' dizisini yanıt başlıklarından çıkarabiliyorum, ancak diziden cookie'leri ayrıştırmak için string işlemleri yapmak son derece hackish. Aşağıdaki yönlendirmeyi yeniden yönlendirin. Her bir isteğin, 302 durum kodu döndüğünde yeniden yönlendirmeler izlemesini istiyorum.
Ben yararlı görünüyordu iki şey geldi ama sonunda kullanamadı: '
http://zombie.labnotes.org/, ancak HTTPS desteğine sahip değil, bu yüzden can kullan.
http://www.phantomjs.org/, ancak kullanamazsınız çünkü node.js. ile entegre (görünmüyor). Yaptığım şey için de oldukça ağır.
Zombie'yi ve güneşin altındaki diğer tüm tarayıcıları denedikten sonra, phantomjs ile birlikte düğümü kullanarak sona erdim ve güzel çalıştı. Düğüm içinde spawn yöntemini kullanır ve hayaletten gelen yanıtları yakalarsınız. Tanımlama bilgileri, yönlendirmeler, oturum açma oturumları ve gelişmiş javascript ile çalışan tek javascript tabanlı çözümdür. Yakında bir blog yazısı oluşturacağım ve geri dönüp yorum yapacağım. – Clint
Ayrıca, http://node.io –