2016-03-24 13 views
0

Bu problem üzerinde sıkışmış durumdayım! Çok büyük bir metin dosyam var (3 milyon satır) ve daha sonra bir tilde içeren tüm satırları kaldırmam gerekiyor. Birisi bana yardım edecek kadar nazik olabilir! Lütfen ve teşekkür ederim .Python daha sonra bir tilde içeren satırları kaldırarak

import re 

f_in = 'C:\\Users\\John\\Documents\\Python\\Pagelinks\\pagelinkSample_10K_cleaned2.txt' 

f_out = 'C:\\Users\\John\\Documents\\Python\\Pagelinks\\pagelinkSample_10K_cleaned3.txt' 

with open(f_in, 'r') as fin: 

     with open(f_out, 'w') as fout: 

       for line in fin: 

burada sıkışmış, tildeli için hat sayısı daha sonra bir silme satır içeriyorsa i düşünüyorum: Burada

var bugüne kadar ne?

Teşekkürler!

+2

Neden grep -v '~~' 'işi yapar? –

cevap

3
for line in fin: 
    if line.count('~') < 2: 
     fout.write(line) 
+3

Öneri: 'line.count ('~') <2:' ise ve 'devam et 'seçeneğini kaldırın. –

+0

Evet, çok daha iyi. –

İlgili konular