Güzel çorba: Tüm alıntıları göster

Tasarım araştırmacısıyım. (" "Olumlu" "69_a"" egzersizleri)Güzel çorba: Tüm alıntıları göster

<q 69_A F exercises positive> Well I think it’s very good. I thought that the exercises that Rosy did was very good. I looked at it a few times. I listened and I paid attention but I didn’t really do it on the regular. I didn’t do the exercises on a regular basis. </q>

Ben tüm etiketler listelemek için çalışıyorum çalışıyorum: Ben bu yüzden gibi çeşitli etiketler verdik hangi 75-100 alıntıları içeren birkaç .txt dosyaları var beautifulsoup kullanarak. Ama bunun yerine bana şöyle bir çıktı verme:

q 
q 
q 
q 
Finished...

Bana Bunu düzeltmek yardım edebilir:

69_a 
exercises 
positive

Bana şöyle bir çıktı veriyor? Bunu yapmak istediğim çok fazla nitel veri var. Amaç, tüm teklifleri bir .xlsx dosyasına vermek ve pivot tabloları kullanarak sıralamaktır.

from bs4 import BeautifulSoup 
file_object = open('Angela_Q_2.txt', 'r') 
soup = BeautifulSoup(file_object.read(), "lxml") 
tag = soup.findAll('name') 

for tag in soup.findAll(True): 
    print(tag.name) 
print('Finished')

kaynak

2016-04-13 Shruti Grover

burada soruyorsun belirsiz şeydir. Lütfen dosya içeriğinizin örneklemini ve beklenen çıktıyı göstermek için sorunuzdaki [düzenle] (http://stackoverflow.com/q/36597494/3100115) bağlantısını kullanın. – styvane

Ne listelemek istediğiniz etiketlere değil, nitelik olarak adlandırılır. Bir etiket özelliklerine erişmek için .attr değerini kullanın. gösterildiği gibi aşağıda

Kullanım:

from bs4 import BeautifulSoup 

contents = '<q tag1 tag2>Quote1</q>dome other text<q tag1 tag3>quote2</q>' 

soup = BeautifulSoup(contents) 

for tag in soup.findAll('q'): 
    print(tag.attrs) 
    print(tag.contents) 
print('Finished')

kaynak

2016-04-14 13:34:23 user611478

Çok teşekkür ederim; Şuan çalışıyor ! –

Güzel çorba: Tüm alıntıları göster

cevap

İlgili konular