Kısa olanla gitmenin bir başka nedeni, işaretlemede bir karakter kümesi belirtebileceğiniz diğer örneklerle eşleşmesidir. Örneğin:
<script type="javascript" charset="UTF-8" src="/script.js"></script>
<p><a charset="UTF-8" href="http://example.com/">Example Site</a></p>
Tutarlılık hataları azaltmaya ve kodu daha okunabilir hale getirmeye yardımcı olur.
Karakter kümesi özniteliğinin büyük / küçük harfe duyarlı olmadığını unutmayın. UTF-8 veya utf-8 kullanabilirsiniz, ancak UTF-8 daha net, daha okunabilir, daha doğrudur.
Ayrıca, meta karakter kümesi özniteliğinde veya sayfa üstbilgisinde UTF-8 dışında bir değer kullanmak için kesinlikle hiçbir neden yoktur. UTF-8, 1999'daki HTML4'ten bu yana Web belgeleri için varsayılan kodlamadır ve modern Web sayfaları oluşturmanın tek pratik yoludur.
Ayrıca UTF-8'de HTML objeleri kullanmamalısınız. Telif hakkı simgesi gibi karakterler doğrudan yazılmalıdır. Kullanmanız gereken tek varlık, ayrılmış 5 biçimlendirme karakteri içindir: "ve" işareti, asal, çift asaldan küçük. Varlıkların, her zaman ileride kullanmak istemeyebileceğiniz bir HTML ayrıştırıcıya ihtiyacı vardır, hatalar ekler, kodunuzu daha az okunabilir hale getirir, dosya boyutlarınızı arttırır ve kullandığınız varlıklara bağlı olarak bazen çeşitli tarayıcılarda yanlış kod çözerler. Telif hakkı, ticari marka, açık fiyat teklifi, alıntıyı kapat, kesme işareti, kısa çizgi, kısa çizgi, madde işareti, Euro ve içeriğinizde karşılaştığınız diğer karakterleri nasıl yazacağınızı / ekleyeceğinizi ve kodunuzdaki bu gerçek karakterleri nasıl kullanacağınızı öğrenin. Mac'te Klavye Sistem Tercihinde açabileceğiniz bir Karakter Görüntüleyici var, ihtiyacınız olan karakterleri bulup sürükleyip bırakabilir veya hangi tuşları yazacağınızı görmek için eşleşen Klavye Görüntüleyicisi'ni kullanabilirsiniz. Örneğin, ticari marka Option + 2'dir. UTF-8, yazılı her insan dilinden tüm karakterleri ve sembolleri içerir. Bu nedenle, em tire yerine - kullanmak için bir mazeret yoktur. Noktalama ve tipografi kurallarını öğrenmek de kötü bir fikir değildir ... örneğin, bir dönemin dışarıda değil yakın bir alıntı içerisine girdiğini bilmek.
İçerik türü ve kodlama gibi bir şey için etiket kullanmak son derece ironiktir, çünkü bunları bilmeden meta etiketin değerini almak için dosyayı ayrıştıramazsınız.
Hayır, bu doğru değil. Tarayıcı dosyayı UTF-8 veya ISO-8859-1 olarak tarayıcının varsayılan kodlaması olarak ayrıştırmaya başlar. US-ASCII hem ISO-8859-1 bir alt kümesidir yana ve UTF-8, tarayıcı aynı olduğunu ... gayet her iki şekilde okuyabilir. Tarayıcı meta karakter kümesi etiketi ile karşılaştığında, kodlama tarayıcının kullanmakta olduğundan farklıysa, tarayıcı sayfayı belirtilen kodlamada yeniden yükler. Bu nedenle meta karakter etiketini, başlık etiketinden hemen sonra, herhangi bir şeyden önce, hatta başlıktan en üste koyduk. Bu şekilde başlığınızda UTF-8 karakterleri kullanabilirsiniz.
Dosyalarınızı BOM olmadan UTF-8 kodlamasına kaydetmelisiniz
Bu kesinlikle doğru değil. Belgenizde yalnızca US-ASCII karakterleri varsa, bunu bir alt küme olduğu için US-ASCII olarak kaydedebilir ve UTF-8 olarak sunabilirsiniz. Ancak Unicode karakterler varsa, haklısınız, BOM olmadan UTF-8 olarak kaydetmelisiniz.
Dosyalarınızı UTF-8'e kaydedecek iyi bir metin editörü istiyorsanız, Notepad ++'ı öneriyorum.
Mac'te, Mac App Store'dan Bare Bones TextWrangler (ücretsiz) veya Mac App Store'da bulunan Bare Bones BBEdit'i 39,99 $ karşılığında kullanın ... böyle harika bir araç için çok ucuz. Her iki uygulamada da belge penceresinin altında belge kodlamasını belirlediğiniz bir menü vardır ve kolayca "UTF-8 no BOM" seçebilirsiniz. Ve elbette bunu Tercihler'deki yeni belgeler için varsayılan olarak ayarlayabilirsiniz.
Ancak, Web sunucunuz önerilen HTTP üstbilgisinde kodlama sağlıyorsa, her iki [meta tag] gereksizdir.
Bu yanlış. Kodlamayı elbette HTTP üstbilgisinde ayarlamanız gerekir, ancak sayfanın kullanıcı tarafından kaydedilebileceği, tarayıcıdan yerel depoya kaydedilebileceği ve daha sonra tekrar açılabileceği şekilde meta karakter kümesi özelliğinde de ayarlamanız gerekir. mevcut olacak kodlamanın tek göstergesi meta karakter kümesi özelliğidir. Aynı nedenden ötürü bir taban etiketi de ayarlamanız gerekir ... sunucuda, taban etiketi gereksizdir, ancak yerel depolamadan açıldığında, taban etiketi sayfanın sunucudaymış gibi çalışmasını sağlar. varlıklar yerinde ve benzeri, hiçbir kırık bağlantılar.
VarsayılanCharset UTF-8 Ekle
Veya sadece aşağıdaki gibi belirli dosya türlerinin kodlamasını değiştirebilirsiniz:
AddType text/html;charset=utf-8 html
Hem UTF-8 hem de Latin-1 (ISO-8859-1) dosyalarına hizmet vermenin bir ipucu, UTF-8 dosyalarına "metin" uzantısı ve Latin-1 dosyalarına "txt" vermektir.
AddType text/plain;charset=iso-8859-1 txt
AddType text/plain;charset=utf-8 text
Son olarak, belgelerinizi eski DOS veya (klasik) Mac satır sonlarıyla değil Unix satır sonlarıyla kaydetmeyi düşünün, bu eski sistemlerden daha da ileri gittikçe, yardım etmeyen ve zarar verebilecek. Geçerli HTML5, UTF-8 kodlaması ve Unix satır sonlarına sahip bir HTML belgesi iyi yapılmış bir iştir. Bu belgeyi birçok bağlamda paylaşabilir ve düzenleyebilir, saklayabilir, okuyabilir, kurtarabilir ve ona güvenebilirsiniz. Lingua franca. Dijital kağıt.