Benim dize Niệm Bồ Tát (Thiá»n sÆ° Nhất Hạnh)
ve ben o http://www.enderminh.com/minh/utf8-to-unicode-converter.aspxPython Kırık utf-8 kodlaması nasıl düzeltilir?
yapabileceği sitede gördüğünüz Niệm Bồ Tát (Thiền sư Nhất Hạnh)
bunu deşifre etmek istiyorum ve ben Python
mystr = '09. Bát Nhã Tâm Kinh'
mystr.decode('utf-8')
tarafından denemeye başlamak ama aslında doğru değil, çünkü Orijinal dize utf-8'dir ancak dize gösterisi benim beklediğim sonuç değildir.
Not: Bu, Vietnamca bir karakterdir.
Bu vaka nasıl çözülür? Windows Unicode falan mı? Burada kodlama nasıl tespit edilir. peşin
görünüyor kullanılarak monte edilebilir 'utf-8' fakat 'latin 1' olarak yorumlanır. – ch3ka
'>>>" Niệm Bồ Tát (Thiền sư Nhất Hạnh) "kodlama ('utf-8') decode ('latin-1')' ''Niá» \ x87m Bá »\ x93 Tát (Thiá »\ x81n sÆ ° NhẠ¥ t Hạnh) '' oldukça yakın ... – ch3ka
@ ch3ka, aslında cp1252, latin-1'in bir üst kümesi –