Aşağıdaki kodu kullanarak veri alıp alamayacağımı görmeye çalışıyorum. Bazı nedenlerle, beautifulsoup çıktısı gördüğüm verileri içermiyor. Nerede yanlış gittiğimi merak ediyorum. Farklı türden başlıklar deniyorum, sorunum olduğunu düşünüyorum ama yanılıyor olabilirim. Mesela ben tarayıcısında sayfayı incelemek zaman aşağıdaki yolu bulamayan değilim: <div class="textbold font-medium ng-binding">$25,000</div>
urllib2 bir web sitesinden doğru verileri çekmiyor Python 2.7
import urllib2
from bs4 import BeautifulSoup
url='https://www.prosper.com/listings#/detail/4964721'
hdr = {'Accept': 'text/html,application/xhtml+xml,*/*',"user-agent":"Mozilla/5.0 (X11; Linux x86_64) AppleWebKit/537.36 (KHTML, like Gecko) Chrome/48.0.2564.116 Safari/537.36"}
req=urllib2.Request(url,headers=hdr)
html = urllib2.urlopen(req)
soup=BeautifulSoup(html,"lxml")
print soup
Gördüğünüz verileri ve ne görmeniz gerektiğini paylaşabilirsiniz? – Sanj
oldukça büyük, ancak tarayıcıdaki sayfayı görebilir ve sağladığım kodu kullanarak sayfayı yazdırabilir ve aynı şey olmadığını görürsünüz. Küçük bir örnek verdim, bu yeterli değilse bana bildirin. – FancyDolphin
Sayfanın çoğu, tarayıcıda yorumlanmış JavaScript koduyla oluşturulmuş gibi görünüyor. Ama BeautifulSoup'in bir JavaScript motoru yok. Örneğin, Selenium'u kullanmayı deneyebilirsiniz. Http://stackoverflow.com/questions/2148493/scrape-html-generated-by-javascript-with-python sayfasına bakın. – mzjn