html5
  • character-encoding
  • 2012-09-13 23 views 15 likes 
    15

    HTML belgesi üzerinden HTTP alınan bir örnek yoksun:HTML5, herhangi bir karakter kodlaması sağlanmadığında HTML belgeleri için varsayılan karakter kodlamasını belirtir mi?

    • HTTP Content-Type başlık
    • HTML <meta charset="<character encoding>" /> HTML5 ile ilgili olarak bir HTML <meta http-equiv='Content-Type' content='Type=text/html; charset=<character encoding>'>

    , varsayılan bir örneğin olduğunu

  • UTF-8, karakter kodlaması olarak kabul edildi mi? Yoksa bir varsayılan seçmek için HTML belgesini okuyan uygulama tamam mı?

  • cevap

    14

    charset bu kuralları kullanılarak belirlenir:

    1. Kullanıcı geçersiz kılma.
    2. "İçerik Türü" alanında bir "HTTP" karakter kümesi "parametresi.
    3. A Bayt Sırası HTML belgesindeki diğer verilerden önce işaretleyin.
    4. "Karakter kümesi" özelliğine sahip bir META bildirimi.
    5. "Content-Type" olarak ayarlanmış bir "http-equiv" özniteliği ve "karakter kümesi" için bir değer ayarlanmış bir META bildirimi. Belirtilmemiş buluşsal analiz.

    ... sonra ...

    1. Karakter Alias ​​Unicode Teknik Standart # 22'de tanımlanan kurallara Eşleştirme göre verilen karakter kodlama dizesi Normale.
    2. kasıtlı yani, bazı sorunlu kodlamaları ile tahrik farklı kodlamalar sanki bir kodlama tedavi
    3. . En yaygın geçersiz kılma, US-ASCII ve ISO-8859-1'i Windows-1252 olarak ele almaktır, ancak bu tabloda listelenen diğer bazı kodlama geçersiz kılmaları vardır. Spesifikasyon notunda, "Yukarıdaki tabloya göre bazı kodlamaları diğer kodlamalar olarak işleme gereksinimi, W3C Karakter Modeli spesifikasyonunun istemli bir ihlalidir."

    Ama en önemli şey şudur:

    Sen daima her HTML belgesi bir karakter kodlama belirtmelisiniz veya kötü şeyler gerçekleşecek. Bunu zor yoldan (HTTP Content-Type üstbilgisi), kolay yoldan (<meta http-equiv> bildirimi) veya yeni yoldan (<meta charset> özniteliği) yapabilirsiniz, ancak lütfen bunu yapın. Web teşekkürler.

    Kaynaklar:

    +0

    sayesinde, bir karakter kodlaması daima tanımlanmalıdır teşekkür ederiz.Üzerinde hiçbir denetim bulunmayan ve hiçbiri belirtilmemişse varsayılan kodlamaya dönüp dönmeyeceğimin farkında olmanız gereken belgeleri doğrularım. –

    +1

    W3 doğrulayıcısının kullandığı mantığı kullanmayı düşünün. Açık kaynak bu yüzden ne yaptığını görmek için sadece koduna bakabilirsiniz. – ThiefMaster

    +1

    Bu, karakter kümesine neden ihtiyaç duyulduğu sorusunu gerçekten yanıtlamaz ve varsayılan ayar bu kadar kötüdür. Ayrıca, bu hala cevap mı? Bu yazıldığından beri 2 yıl geçti ve o zamandan beri tarayıcılar çok yükseltildi. IE yok, ama eski versiyonlar düştü. – trysis

    İlgili konular