2012-06-19 21 views
13

Bazı Unicode verileri, herhangi bir kodlama yapılmadan "\ u84b8 \ u6c7d \ u5730" şeklinde dosyada saklanır.Python Unicode dizesi ' u84b8 u6c7d u5730' olarak dosyada saklanır, nasıl geri dönüştürülür Unicode?

Onları Python'da geri gizlemek için bir yol var mı?

+3

Eğer ' '\\ u84b8 \\ u6c7d \\ u5730'' veya' u' \ u84b8 \ u6c7d \ u5730'' ifade ediyor mu? –

+0

@Chris: Ters eğik çizgilerden kaçmaya gerek yok, çünkü tüpten geçerli bir kaçış değil. –

+0

@ IgnacioVazquez-Abrams: Biliyorum; Anlamımı daha belirgin hale getirmek için ikiye katlanan ters eğik çizgi ile koydum –

cevap

43
>>> print '\u84b8\u6c7d\u5730'.decode('unicode-escape') 
蒸汽地 
+2

Sanırım bunun muhtemelen ne anlama geldiğini bilmiyorum, ama emin değilim ... eğer öyle ise, yine de bir kopya. –

+0

Bu iyi. İşte başka bir alternatif form: 's = unicode ('\ u84b8 \ u6c7d \ u5730', 'unicode kaçış')'. – Keith

+0

Bu sorunu çözmeye çalışırken çok zaman harcadım, şimdi çözümünüzü gördüm! – SKandeel