2012-07-10 18 views
12

"aa \ nbb \ ncc" dizesi için, son son satırdan ilk yeni satıra ("a") sonuna geçmek istiyorum. çok hat dize ve

"aa\nbb\ncc" =~ qr/(. $ .+)/xmsa\nbb\ncc

ve bu

"aa\nbb\ncc\n" =~ qr/(. $ .+)/xms maçlar a\nbb\ncc\n eşleştiğini bekleniyor.

Ancak "aa\nbb\ncc" =~ qr/(. $ .+)/xms için eşleşme yok ve "aa\nbb\ncc" =~ qr/(. $ .+)/xms için eşleşme.

qr/(. $ ..+)/xms Kullanarak beklenen sonuçları aldım (bkz. Örnek kod).

Perl sürüm 5.14.2.

Bu davranış hakkında herhangi bir açıklama yapan var mı?

perldoc perlre: Aşağıdaki örnek kod çalıştırma

m Treat string as multiple lines. That is, change "^" and "$" 
     from matching the start or end of the string to matching the start 
     or end of any line anywhere within the string. 

    s Treat string as single line. That is, change "." to match any character 
     whatsoever, even a newline, which normally it would not match. 

     Used together, as "/ms", they let the "." match any character whatsoever, 
     while still allowing "^" and "$" to match, respectively, just after and 
     just before ewlines within the string. 

    \z Match only at end of string 

:

#!/usr/bin/env perl 

use strict; 
use warnings; 

print "Multiline string : ", '"aa\nbb\ncc"', "\n\n"; 
my $str = "aa\nbb\ncc"; 

print_match($str, qr/(. $)/xms);  # matches "a" 
print_match($str, qr/(. $ .)/xms);  # matches "a\n" 
print_match($str, qr/(. $ ..)/xms); # matches "a\nb" 
print_match($str, qr/(. $ ..+)/xms); # matches "a\nbb\ncc" 
print_match($str, qr/(. $ .+)/xms); # NO MATCH ! Why ??? 
print_match($str, qr/(. $ .+ \z)/xms); # NO MATCH ! Why ??? 

print "\nMultiline string now with terminating newline : ", '"aa\nbb\ncc\n"', "\n\n"; 
$str = "aa\nbb\ncc\n"; 

print_match($str, qr/(. $)/xms);  # matches "a" 
print_match($str, qr/(. $ .)/xms);  # matches "a\n" 
print_match($str, qr/(. $ ..)/xms); # matches "a\nb" 
print_match($str, qr/(. $ ..+)/xms); # matches "a\nbb\ncc\n" 
print_match($str, qr/(. $ .+)/xms); # MATCHES "c\n" ! Why ??? 
print_match($str, qr/(. $ .+ \z)/xms); # MATCHES "c\n" ! Why ??? 

sub print_match { 
    my ($str, $regex) = @_; 
    $str =~ $regex; 
    if ($1) { 
     printf "--> %-20s matched : >%s< \n", $regex, $1; 
    } 
    else { 
     printf "--> %-20s : no match !\n", $regex; 
    } 
} 

çıktısı:

Multiline string : "aa\nbb\ncc" 

--> (?^msx:(. $))  matched : >a< 
--> (?^msx:(. $ .)) matched : >a 
< 
--> (?^msx:(. $ ..)) matched : >a 
b< 
--> (?^msx:(. $ ..+)) matched : >a 
bb 
cc< 
--> (?^msx:(. $ .+)) : no match ! 

Multiline string now with terminating newline : "aa\nbb\ncc\n" 

--> (?^msx:(. $))  matched : >a< 
--> (?^msx:(. $ .)) matched : >a 
< 
--> (?^msx:(. $ ..)) matched : >a 
b< 
--> (?^msx:(. $ ..+)) matched : >a 
bb 
cc 
< 
--> (?^msx:(. $ .+)) matched : >c 
< 
+0

Bu Perl'de bir hata gibi görünüyor. İyi bul! Related:: "a \ nb", "m/a $ ... \ z/ms" yerine "m/a $ .. \ z/ms" ile eşleşir; * ama *, ne olup bittiğini anlamaya çalışmak için noktaların etrafında parantez eklediğimde, aniden m/a $ (.) yerine m/a $ (.) (.) \ z/ms 'ile eşleşir. .) (.) \ z/ms'. – ruakh

+0

Oldukça garip. Perl ile aynı 5.12.2. – katastrophos

cevap

8

Bu bir böcek. Lütfen perlbug komut satırını da kullanarak rapor edin. Dediğin gibi

$ perl -E'say "aa\nbb\ncc" =~ qr/(. $ .+)/xms ? ">$1<" : 0' 
0 

$ perl -E'say "aa\nbb\ncc\n" =~ qr/(. $ .+)/xms ? ">$1<" : 0' 
>c 
< 

$ perl -v 
... 
This is perl 5, version 16, subversion 0 (v5.16.0) built for x86_64-linux 
... 

, bunlar sırasıyla "a\nbb\ncc" ve "a\nbb\ncc\n" uyumlu olmalıdır. $ ile ilgili optimizasyonlar var. Bunlardan biri /ms'u hesaba katamadı.


PS — Sen use re 'debug'; ilginizi çekebilir.

$ perl -Mre=debug -E'say "aa\nbb\ncc" =~ qr/(. $ .+)/xms ? ">$1<" : 0' 
Compiling REx "(. $ .+)" 
Final program: 
    1: OPEN1 (3) 
    3: SANY (4) 
    4: MEOL (5) 
    5: PLUS (7) 
    6:  SANY (0) 
    7: CLOSE1 (9) 
    9: END (0) 
anchored ""$ at 2 minlen 2 
Matching REx "(. $ .+)" against "aa%nbb%ncc" 
    0 <> <aa%nbb%ncc>   | 1:OPEN1(3) 
    0 <> <aa%nbb%ncc>   | 3:SANY(4) 
    1 <a> <a%nbb%ncc>   | 4:MEOL(5) 
            failed... 
    3 <aa%n> <bb%ncc>   | 1:OPEN1(3) 
    3 <aa%n> <bb%ncc>   | 3:SANY(4) 
    4 <aa%nb> <b%ncc>   | 4:MEOL(5) 
            failed... 
    6 <aa%nbb%n> <cc>   | 1:OPEN1(3) 
    6 <aa%nbb%n> <cc>   | 3:SANY(4) 
    7 <aa%nbb%nc> <c>   | 4:MEOL(5) 
            failed... 
Match failed 
0 
Freeing REx: "(. $ .+)" 
+0

perl 5.16.0 da etkileniyor. Bir hata raporu göndereceğim. Yeniden 'debug' kullanmamı işaret ettiği için Tnx. Perl 5.18 içinde – katastrophos

+1

[Düzeltildi] (http://perl5.git.perl.org/perl.git/commitdiff/ac7af3f615eb56bda50bf123662b15779da26826?hp=79a3e5ea36208f2f54e36fa3a73c72808a6d0ad8) – ikegami