In. Net \p{L}
'u herhangi bir harfi eşleştirmek için kullanabilirsiniz, Python'da nasıl yapabilirim? Yani, büyük harf, küçük harf ve aksanlı harflerle eşleştirmek istiyorum.Herhangi bir unicode mektubu eşleştirin mi?
cevap
Python'un re
modülü henüz Unicode özelliklerini desteklemiyor. Ancak regex'inizi re.UNICODE
bayrağını kullanarak derleyebilirsiniz ve daha sonra \w
kestirme karakter sınıfı da Unicode harfleriyle eşleşecektir. \w
da basamak maç olacak yana
, daha sonra çizgi ile birlikte, karakter sınıfından olanlar çıkarmak gerekir:
[^\W\d_]
herhangi bir Unicode harfi eşleşir.
>>> import re
>>> r = re.compile(r'[^\W\d_]', re.U)
>>> r.match('x')
<_sre.SRE_Match object at 0x0000000001DBCF38>
>>> r.match(u'é')
<_sre.SRE_Match object at 0x0000000002253030>
Zeki, ama işe yaramıyor. Güncellemeye bakın. Bunu http://en.wikipedia.org/wiki/List_of_Unicode_characters adresinden kopyaladım, fark etmiyor gibi görünüyor. – mpen
Mükemmel çalışır, ancak bir Unicode nesnesi değil, bir bayt dizesidir. –
Teşekkürler çocuklar! Darn unicode :) Hiçbir şeyden başka sorun çıkarır. – mpen
- 1. JSON, "herhangi bir UNICODE karakteri" ni belirtir?
- 2. Java: Anahtar olarak herhangi bir enum ile eşleştirin
- 3. SQL'de Sorguyu Normal Bir İfade ile Eşleştirin mi?
- 4. Herhangi bir Unicode karakterini üstün metne nasıl yazarım?
- 5. Bir özniteliği l20n ile eşleştirin
- 6. JSON Unicode çıkış dizisi - küçük harf mi yoksa değil mi?
- 7. Bir Eigen Matrix'i bir C dizisine eşleştirin
- 8. Simple Regex, en az bir tire ile herhangi bir dizgi eşleştirin
- 9. Scala'da bilinmeyen boyutta bir tuple eşleştirin
- 10. Satırları CLOB ile eşleştirin
- 11. Unicode
- 12. RegEx: Yeni satırlar da dahil olmak üzere herhangi bir karakteri eşleştirin?
- 13. Kısmi dizeyi başka bir dizelerle eşleştirin
- 14. grep komutuyla belirli bir sütunu eşleştirin
- 15. RSpec: Bir dizi diziyi regex ile eşleştirin
- 16. Kaçınan unicode karakterleri unicode gösterimine dönüştürme
- 17. C# - Her UpperCase Mektubunu, Alt Çizgi ve Mektubu ile Değiştir
- 18. Tamilde Unicode sri karakteri
- 19. Unicode karakterler
- 20. Herhangi bir HTML öğesi bir fieldet/lejant olarak tasarlanabilir mi?
- 21. SqlParameterCollection öğesini Moq ile eşleştirin
- 22. Eşzamanlı etiketleri eşleştirin Java Dizesi
- 23. Neo4j - Kimlikler kullanarak birden çok düğümü eşleştirin
- 24. Python: Unicode
- 25. Linux'ta, bir zip dosyasında birden çok dizini zip dosyasıyla eşleştirin
- 26. Birisi Gson unicode kodlamasını netleştirebilir mi? Aşağıdaki minimalistik örnekte
- 27. Unicode karakteri için Python unicode kod noktası
- 28. Unicode unicode, UnicodeDecodeError'ı günlüğe kaydetme (App Engine)
- 29. Bir OStream'e Unicode Karakterlerini Yazma
- 30. Base64ing Unicode karakterler
Bkz: http://stackoverflow.com/questions/1832893/python-regex-matching-unicode-properties Sen ' 'é'' [2.x bir' unicode' olmadığını biliyoruz –
] (http://farmdev.com/talks/unicode/), değil mi? –
Denemeyi deneyin (u'é ') ' –