2016-04-13 26 views
1

Tasarım araştırmacısıyım. (" "Olumlu" "69_a"" egzersizleri)Güzel çorba: Tüm alıntıları göster

<q 69_A F exercises positive> Well I think it’s very good. I thought that the exercises that Rosy did was very good. I looked at it a few times. I listened and I paid attention but I didn’t really do it on the regular. I didn’t do the exercises on a regular basis. </q> 

Ben tüm etiketler listelemek için çalışıyorum çalışıyorum: Ben bu yüzden gibi çeşitli etiketler verdik hangi 75-100 alıntıları içeren birkaç .txt dosyaları var beautifulsoup kullanarak. Ama bunun yerine bana şöyle bir çıktı verme:

q 
q 
q 
q 
Finished... 

Bana Bunu düzeltmek yardım edebilir:

69_a 
exercises 
positive 

Bana şöyle bir çıktı veriyor? Bunu yapmak istediğim çok fazla nitel veri var. Amaç, tüm teklifleri bir .xlsx dosyasına vermek ve pivot tabloları kullanarak sıralamaktır.

from bs4 import BeautifulSoup 
file_object = open('Angela_Q_2.txt', 'r') 
soup = BeautifulSoup(file_object.read(), "lxml") 
tag = soup.findAll('name') 

for tag in soup.findAll(True): 
    print(tag.name) 
print('Finished') 
+2

burada soruyorsun belirsiz şeydir. Lütfen dosya içeriğinizin örneklemini ve beklenen çıktıyı göstermek için sorunuzdaki [düzenle] (http://stackoverflow.com/q/36597494/3100115) bağlantısını kullanın. – styvane

cevap

0

Ne listelemek istediğiniz etiketlere değil, nitelik olarak adlandırılır. Bir etiket özelliklerine erişmek için .attr değerini kullanın. gösterildiği gibi aşağıda

Kullanım:

from bs4 import BeautifulSoup 

contents = '<q tag1 tag2>Quote1</q>dome other text<q tag1 tag3>quote2</q>' 

soup = BeautifulSoup(contents) 

for tag in soup.findAll('q'): 
    print(tag.attrs) 
    print(tag.contents) 
print('Finished') 
+0

Çok teşekkür ederim; Şuan çalışıyor ! –

İlgili konular