2012-04-28 25 views

cevap

54

Unicode, günümüzde aktif kullanımdaki hemen hemen tüm dillerdeki karakterlere ve ayrıca matematiksel semboller gibi diğer birçok karaktere özgü kodları (kod noktaları olarak adlandırılan) atamanın bir yoludur. Unicode dizelerini UTF-8 ve UTF-16 gibi bayt olarak kodlamanın birçok yolu vardır.

ASCII değerleri yalnızca 128 karakter atar (a-z, A-Z, 0-9, boşluk, bazı noktalama işaretleri ve bazı kontrol karakterleri).

ASCII değerine sahip her karakter için, Unicode kod noktası ve bu karakterin ASCII değeri aynıdır.

Çoğu modern uygulamada ASCII yerine Unicode dizeleri kullanmayı tercih etmelisiniz. Bu, örneğin, kullanıcıların adlarında veya adreslerinde aksanlı karakterler bulundurmanıza ve arabiriminizi ingilizce dışındaki dillere yerelleştirmenize olanak tanır.

+0

Ancak unicode karakterleri nasıl kullanırım? Ascii karakterlerini sadece yazı karakterlerini inters içine yazarak kullanabilirim, ama unicode karakterlerle aynı şeyi yapabilir miyim? – Ghost

+0

@Ghost: Neden karakterleri inters'e çevirmeniz gerektiği açık değil. Ne yapmaya çalışıyorsun? –

+0

söylediklerim bir karakterin ascii değerini elde etmek için şunu yazmalıyım: char a = 'a'; int b = (int) a – Ghost

14

İlk 128 Unicode kod noktaları ASCII ile aynıdır. Daha sonra 100.000 veya daha fazla var.

Unicode, UTF-8 için her bir değer için 1-4 bayt kullanan iki ortak biçim vardır (böylece ilk 128 karakter için UTF-8, ASCII ile tam olarak aynıdır) ve 2 veya 4 kullanan UTF-16'dır. bayt.

İlgili konular