2011-11-25 10 views
8

Twitter'ın akış API'sinin resmi kodlaması nedir? En iyi tahminim, gördüklerime dayanarak UTF-8'dir, ancak varsayımlardan kaçınmak istiyorum.Twitter Streaming API tarafından kullanılan resmi kodlama? UTF-8 mi?

hatta onların resmi kodlama olarak kullandığımız ipucu nerede gördüm Heyecan sitenin sadece bir parçası buradadır:

Heyecan biz UTF kullanmak aslında bir kullanıcı cezalandırmak istemiyor

-8 veya gerçeği söz konusu API istemci herkes daha "resmi" cevap var mı artık temsilini

https://dev.twitter.com/docs/counting-characters

kullandığını? Belirli varsayımları yapan akış API'sı için bir devlet-makine belirteci yazıyorum. İstediğim son şey UTF-16 gibi bir şeyle karşılaşmak.

Teşekkürler! : D

cevap

4

Bir gösterge, Twitter'ın neredeyse her şey için kullandığı JSON format'un, UTF-8'i zorunlu kıldığını (veya en azından varsayılan olarak) belirlediğidir. Onlar kodlamasını ifade eden uygun bir HTTP başlığı da ayarlamalıdır (ancak bunu doğrulamamıştım). Bunun yerine XML kullanıyorsanız, XML açılış etiketi UTF-8 olan kodlamayı açıkça belirtir.

0

UTF-8 kullandığını söylerlerse, bu oldukça iyi bir bahistir. UTF-8 çok yaygın ve vahşi doğada UTF-16 gördüğüm kadarıyla oldukça nadirdir.

Ayrıca, çeşitli karakterleri destekleyip desteklemediklerini sınayarak kendinizi kanıtlamaya meyilliyseniz, kullanabileceğiniz bazı akıllı kütüphaneler de vardır. Bunların en iyisi, Firefox tarafından, yüklendikçe web sayfalarının kodlanmasını algılamak için kullanılır: http://www-archive.mozilla.org/projects/intl/UniversalCharsetDetection.html

İlgili konular