Bir kelimem var: "Aiavärav". \w+
ifadesi bu sözcüğü yakalamalı, ancak "ä" harfi sözcüğü yarıya indirir. "Aiavärav" yerine "Aia" yı alırım. Ascii olmayan harfleri içeren kelimeler için doğru ifade nedir?Java'nın Normal İfadesi, diğer dillerdeki karakterleri kelime karakterleri olarak tanımıyor (i.e w)
Pattern.compile("\\w+", Pattern.UNICODE_CHARACTER_CLASS)
veya desende bir (?U)
gömmek: Eğer UNICODE_CHARACTER_CLASS
bayrağı belirtmedikçe
Sözcüğü kopyaladım ve dizeye koydum, normal ifadeyi kullandım + w + ve sözcüğü doğru şekilde alabiliyorum. C# ile test ediyorum. –
Java kullanıyorum. Ayrıca myregextester.com ile test ettim ve hala tüm kelimeyi tanımıyor. – jyriand
Belki de [Unicode harfler] 'e bakmak istersiniz (http://www.regular-expressions.info/unicode.html)? '\ p {L} +' – Wiseguy