Python'da regex ile dosyanın eşleştirilmesi ve sonlandırılması

Python'da bir dosyanın başlangıcı ve bitişi için normal ifadeyi bulmakta zorlanıyorum. Bunu nasıl başarabilirim? Belki de yapmaya çalıştığınız şey gibi, sorunuzu daha açık bir şekilde ortaya koymalıydınız.Python'da regex ile dosyanın eşleştirilmesi ve sonlandırılması

kaynak

2010-03-02 zlack

Normal ifadeler dizeleri değil, dosyalar uygulanır. – MattH

Bu, dosyayı bir bütün dizeye dağıtabilirsiniz ve yeniden kullanarak deseninizi eşleştirebilirsiniz.

import re 
data=open("file").read() 
pat=re.compile("^.*pattern.*$",re.M|re.DOTALL) 
print pat.findall(data)

İstediğinizi yapmak için daha iyi yollar vardır;

kaynak

2010-03-02 10:51:38 ghostdog74

Çünkü. * Açgözlüdür, bir dosyada yalnızca 'desen' örneğini bulacaktır. Re.M bayrağını belirttiğinizden beri, dosyadaki her yeni satırın hemen karşısındaki $ eşleşmesi, yani açgözlü. * Ve re.DOTALL, ilk. * Dosyadaki son 'kalıptan önceki her şeyle eşleşecek ve ikincisi Son 'desen' sonra her şeyi maç. –

ne olursa olsun. OP tam olarak ne yapmak istediğinden emin olmadığımızdan, bu tam bir çözüm değildir. Yapabileceğim en iyi şey, tüm dosyayı bir dize olarak okuyabildiğini ve normal dizgiler gibi normal ifadeleri kullanabileceğini söylemek. – ghostdog74

regex $değil arkadaşın; bkz. this SO answer

kaynak

2010-03-02 13:13:29

Tüm dosyayı bir dizeye okuyun, ardından \ A bir dizenin yalnızca başlangıcıyla eşleşir ve \ Z yalnızca bir dizenin sonuna denk gelir. Re.MULTILINE ile '^', bir satırsonu hemen sonra ve dizesinin başlangıcıyla eşleşir ve '$' dizesi ve dizgisinin sonuna yeni satırdan hemen önce eşleşir. re syntax için Python belgelerine bakın.

import re 

data = '''sentence one. 
sentence two. 
a bad sentence 
sentence three. 
sentence four.''' 

# find lines ending in a period 
print re.findall(r'^.*\.$',data,re.MULTILINE) 
# match if the first line ends in a period 
print re.findall(r'\A^.*\.$',data,re.MULTILINE) 
# match if the last line ends in a period. 
print re.findall(r'^.*\.$\Z',data,re.MULTILINE)

Çıktı:

['sentence one.', 'sentence two.', 'sentence three.', 'sentence four.'] 
['sentence one.'] 
['sentence four.']

kaynak

2010-03-02 13:14:35

Python'da regex ile dosyanın eşleştirilmesi ve sonlandırılması

cevap

İlgili konular