2011-06-28 13 views
24

, ben onun değerini okuyabilir:Unicode ham değişmezlerini okunabilir dizeye nasıl çözülür? Bir değişkene unicode ham değişmezleri atarsanız

>>> s = u'\u0421\u043e\u043e\u0431\u0449\u0435\u043d\u0438\u0435 \u043e\u0442\u043f\u0440\u0430\u0432\u043b\u0435\u043d\u043e' 
>>> s 
u'\u0421\u043e\u043e\u0431\u0449\u0435\u043d\u0438\u0435 \u043e\u0442\u043f\u0440\u0430\u0432\u043b\u0435\u043d\u043e' 
>>> print s 
Сообщение отправлено 

Ama zaten bir ova değer atamış zaman değil Unicode dize, yapamam:

>>> s = '\u0421\u043e\u043e\u0431\u0449\u0435\u043d\u0438\u0435 \u043e\u0442\u043f\u0440\u0430\u0432\u043b\u0435\u043d\u043e' 
>>> s 
'\\u0421\\u043e\\u043e\\u0431\\u0449\\u0435\\u043d\\u0438\\u0435 \\u043e\\u0442\\u043f\\u0440\\u0430\\u0432\\u043b\\u0435\\u043d\\u043e' 
>>> print s 
\u0421\u043e\u043e\u0431\u0449\u0435\u043d\u0438\u0435 \u043e\u0442\u043f\u0440\u0430\u0432\u043b\u0435\u043d\u043e 

Bunu nasıl çözebilirim ve okuyabilirim?

cevap

31

Kullanım unicode_escape codec:

s.decode('unicode_escape') 
+3

(Bunun nedeni, '\ uXXXX' un * Unicode olmayan bir dizgi içinde * verbatim * olmasıdır.) –

+0

Rusça karakterler için özel olarak en iyi çözümü buldu –

0

print repr(s).decode('unicode-escape').encode('latin-1') // or encode using some other encoding 

Varsayılan ASCII kullandığı piton terminali olabilir aşağıdaki deneyin deşifre ve dışına gider sembolü olduğunda garip sonuçlar alıyorsanız aralık.