Bir web sayfasındaki belirli bir "giriş" etiketindeki tek bir "değer" özelliğinin içeriğini ayıklamaya çalışıyorum. Bir TypeError olsunÖznitelik değeri beautifulsoup ile ayıklanıyor
import urllib
f = urllib.urlopen("http://58.68.130.147")
s = f.read()
f.close()
from BeautifulSoup import BeautifulStoneSoup
soup = BeautifulStoneSoup(s)
inputTag = soup.findAll(attrs={"name" : "stainfo"})
output = inputTag['value']
print str(output)
: Aşağıdaki kodu kullanın BeautifulSoup belgelerinden i dizeleri Burada bir sorun olmamalı anlıyoruz rağmen
str değil, liste endeksleri tamsayı olmalı ... ama uzman değilim ve yanlış anlaşılmış olabilirim.
Herhangi bir öneri çok takdir edilmektedir! Şimdiden teşekkürler. böylece tüm bulunan elemanların
Büyük şeyler! Teşekkürler. Şimdi ASCII olmayan karakterlerin uzun bir demetini çıkaran çıktıyı ayrıştırma hakkında bir sorum var ama bunu ayrı bir soruyla soracağım. – Barnabe
, "değere" http://stackoverflow.com/questions/2616659/extracting-value-in-beautifulsoup adresine göre erişilmemelidir. Yukarıdaki kod bu durumda ne yapar? Değere 'output = inputTag [0] yaparak erişmeniz gerektiğini düşündüm.content ' – Seth
@Seth - no, çünkü giriş etiketinin özniteliğini' değer 'arıyor ve .contents etiketi tarafından kapsüllenmiş metni döndürür ( Ben .contents) - (sadece yanıtladığım için şimdi iki katına çıktım çünkü ne olup bittiğini kontrol edin, başka birinin faydası olabilir) –