2016-03-23 20 views
1

Yeni satır char tarafından sınırlandırılmış bir ngram listesiyle bir dosyam var. Bu şuna benzer: Ben de aynı zamanda satır Char ile sınırlanmış cümlelerin hatları içeren bir metin dosyası varPython: Bir satır dosyasında, satır başına ngramların sayısını denetleme

got to love 
makes perfect sense 
going to be 
would have guessed 
can not wait 
more important than 

. Lets o suna benziyor:

I got to love you. 
Hello world 
Well boy 
That makes perfect sense. I can not wait. 
Hello 

bir bütün olarak, her hat üzerinden yineleme ve kaç kez saymak mümkün istiyorum, bu ngrams herhangi biri meydana. Bu nedenle yukarıdakiler için çıktımız şu olur: Bu nasıl başarırdım? açık olan sayısı = 0 ("tr_response_trigrams_list.txt") f olarak:

+0

gerisini bırakın : f ngram için : doğrultusunda ngram eğer: açıkta hattı için sayısı + = 1 baskı sayısı ("/ Users/kullanıcı/Kod/soyut/veri/Eğitim (3500) /3500_Response_Tweets.txt", "r"): checkLine (satır) ' – dizzle

+0

Programınızın nasıl çalışması gerektiğini bilmiyorum, neden 4. satırda 2 var? – niklas

+0

Her ikisi de 'mükemmel bir anlam ifade eder' ve 'bekleyemez' – dizzle

cevap

0

Ben bu çalışmıştı ama onun tamamen sıfırlı `def checkLine (hat) dönen size

for sentence in sentences: 
    count = 0 
    for ngram in ngrams: 
     if ngram in sentence: 
      count += 1 
    print count 
İlgili konular