Yeni satır karakterlerinde (Windows, OS X ve Unix metin dosyası yeni satır karakterleri için catering) bir dizeyi bölmeye çalışıyorum. Bunların herhangi bir ardıl olması durumunda, buna da bölünmek istiyorum ve sonuçta herhangi bir içermez.Yeni satır karakterlerinin art arda bölünmesi için regex
"Foo\r\n\r\nDouble Windows\r\rDouble OS X\n\nDouble Unix\r\nWindows\rOS X\nUnix"
sonucu olacaktır:
Yani, aşağıdaki bölüşülürken
['Foo', 'Double Windows', 'Double OS X', 'Double Unix', 'Windows', 'OS X', 'Unix']
Ne regex kullanmalıyım?
diğer dikey boşluk konusunda endişeli misiniz? \ r \ n DOS'tır, ancak dikey sekme ve Unicode NBSP, PS, LS, NNBSP gibi başka olası dikey boşluklar da vardır. Python'un jenerik yeni hat konseptini destekleyip desteklemediğini kontrol etmek isteyebilirsiniz. Perl, sırasıyla herhangi bir dikey dikey boşluk veya satır besleme ile eşleşen \ v ve \ R öğelerine sahiptir. Eğer değilse, Unicode karakterleri istiyorsanız, bunları [\ r \ n] + karakter sınıflarınıza ve bu Unicode karakterlerini aramanın Python eşdeğerine ekleyin. – dawg