Aldığım yorumlara dayanarak bunu biraz daha araştırdım. Görünüşe göre şu anda en iyi uygulama HTML varlıklarını kullanmaktan vazgeçmek ve bunun yerine gerçek UTF-8 karakterini kullanmak . Listelenen nedenler aşağıdaki gibidir:
- Karakterin ne anlama geldiğini anlayan ve nasıl yazılacağını bilenler için UTF-8 kodlamalarını okumak ve düzenlemek daha kolaydır.
- UTF-8 kodlamaları, onları anlamayanlar için HTML varlık kodlamaları kadar anlaşılmazdır, ancak ondalık veya onaltılık kodlamaları anlamaktan çok özel karakterler olarak oluşturma avantajına sahiptirler.
Sayfanızın kodlaması doğru şekilde UTF-8'e ayarlandığı sürece, bir HTML varlığı yerine gerçek karakteri kullanmalısınız. Bu konuyla ilgili birkaç belge okudum, ancak en yardımcıları şunlardı:
Gönderen Karakter Kodlama Secret: UTF-8 maddesinde:
Wikipedia, başlangıçta ISO-8859-1'i kullanan ancak yabancı dilleri desteklemek için çok hantal hale geldiğinde UTF-8'e geçen bir uygulama için harika bir örnek olaydır. Botlar artık makaleleri gözden geçirecek ve kullanıcı kolaylığı ve aranabilirlik uğruna karakter varlıklarını karşılık gelen gerçek karakterlere dönüştürecek .
Bu makale ayrıca Çince kodlamayla ilgili güzel bir örnek veriyor. İşte tembellik uğruna kısaltılmış örnek:
UTF-8:
這兩個字是甚麼意思
HTML Varlıkları :
這兩個字是甚麼意思
UTF-8 ve HTML varlık kodlamaları benim için anlamsız, ancak en azından UTF-8 kodlaması yabancı dil olarak tanınabilir ve bir düzenleme kutusunda düzgün şekilde işlenecektir. Makale, HTML varlık kodlamalı sürüm hakkında şunları söylemeye devam ediyor:
Hangi karakter varlıklarının gerçekten ne olduğunu bilenler için son derece rahatsız edici, bilmeyen fakir kullanıcılar için tamamen anlaşılmaz! & Theta; gibi biraz daha kullanıcı dostu, "anlaşılır" karakter varlıkları bile; HTML öğrenmekle ilgilenmeyen kullanıcıları kafalarını kaşıyarak bırakacaktır. Öte yandan, bir düzenleme kutusunda θ görürlerse, bunun özel bir karakter olduğunu bilirler ve bu karakteri kendileri nasıl yazacaklarını bilmeseler bile ona göre davranırlar.
Diğerlerinin de belirttiği gibi, ayrılmış XML karakterleri (ve işareti, küçüktür, büyüktür) için HTML varlıkları kullanmanız gerekir.