Unicode sözcükleri ruby 1.9 ile nasıl eşleştirilir?

Ben yakut 1.9 kullanarak ve dışarı ben bu doğru yapmak gerekir regex hangi bulmaya çalışıyorum:Unicode sözcükleri ruby 1.9 ile nasıl eşleştirilir?

Encoding.default_internal = Encoding.default_external = 'utf-8' 
"föö".match(/(\w+)/u)[1] == "föö" 
# => false

kaynak

2010-08-26 Reactormonk

Her iki dizeyi de eşleştirebileceğinizle aynı unicode dönüştürmeniz gerekir. Iconv ile dizginizi belirli unicode'a dönüştürebilirsiniz. –

Varsayılan Kodlama eklendi. Hala çalışmıyor ... – Reactormonk

"Script utf-8" kodunun başında "# kodlama utf-8" yazınız ve emin olun ki bu script dosyası utf-8'dir. – Nakilon

# encoding=utf-8 
p "föö".match(/\p{Word}+/)[0] == "föö"

kaynak

2010-08-26 15:18:27 steenslag

oh, seni seviyorum! – Hock

Regexp'in doğru kodlamayla doğru şekilde davranmasını sağlamak için kaynak kodu UTF8 olarak etiketlemeniz gerektiği için çılgınsınız. Çok teşekkürler ! – demental

Bunun için iyi bir dokümantasyon şu adreste bulunabilir: http://www.ruby-doc.org/core-1.9.3/Regexp.html#label-Character+Properties –

http://www.ruby-forum.com/topic/208777

http://www.ruby-forum.com/topic/210770

sizin için ipuçları olabilir.

yapabilirsiniz ayrıca (belgelenmiş) \p{L} mülkiyet, ex kullanın: iç (?u) sözdizimi kullanılarak

$ ruby -ve "p '℉üüü' =~ /\p{L}/" 
ruby 1.9.2p0 (2010-08-18 revision 29036) [x86_64-linux] 
1

kaynak

2010-08-26 14:53:06 rogerdpack

yapabilirsiniz manually turn on Unicode matching:

"föö".match(/(?u)(\w+)/)[1] == "föö" 
# => true

Ancak Unicode özellik Syntax'i kullanarak (ikisi de Unicode kod noktalarına otomatik olarak saygı duyduklarından, steenslag'ın cevabı) veya POSIX Parantezleri Sözdizimi daha iyi bir stildir:Ruby regexes'teki Unicode karakterleri eşleme hakkında daha fazla bilgi için bkz. Bkz. Bkz. ..

kaynak

2016-06-24 14:08:17

Unicode sözcükleri ruby ​​1.9 ile nasıl eşleştirilir?

cevap

İlgili konular

Unicode sözcükleri ruby 1.9 ile nasıl eşleştirilir?