Özellikle Japonya'da geliştirilen, UTF-8 veya başka bir Unicode gösterimini varsayılan kodlama dili kodlaması yapmamamın nedenini hatırlıyorum:
- Sebep 1: Han birleşmesi . Karakter kümeleri (burada "alfabe" nin doğru olup olmadığından emin değilsiniz), Çin, Kore ve Japonya'nın hepsi birbiriyle ilişkiliydi, ayrıntılar hakkında emin değillerdi, ortak tarihçeden gelişti. Unicode konsorsiyumu, görünümleri aynı 3 dilde de olsa, aynı karakterdeki tüm varyantları (Çince, Japonca ve Korece) kodlamak için yalnızca tek bir Unicode kod noktasını boşa harcama kararı aldı. Sebep, görünüş, metni görüntülemek için kullanılan font tarafından belirlenmelidir.
Anlaşılan, bu akıl yürütme, Japonca kullanıcılar tarafından saçma olduğu anlaşılıyor, çünkü Latince alfabesi Yunan alfabesinden geldiği için, Latin alfabesinin Yunan alfabesinden geldiği için, yalnızca tek bir kod noktasına sahip olmak yeterlidir. ” α "ve Latin" a "ve görünümün kullanılan font tarafından belirlenmesine izin verin. ("Β" = "b", "γ" = "g" vb. İçin aynı)
(Durum böyle olsaydı burada stackexchange'te yunanca karakterleri ekleyemeyeceğime dikkat edin.)
- Sebep 2: Yetersiz karakter dönüşümleri.
Karakterleri Unicode'dan eski Japonca kodlamalara ve geriye dönüştürmek için tablolar gerekir, yani Unicode kod noktası değerinden eski kod noktası değerine basit bir hesaplama yoktur ve bunun tersi de geçerlidir. Ayrıca dönüştürürken bir miktar bilgi kaybı söz konusudur çünkü bir kodlamadaki tüm kod noktaları diğer kodlamada benzersiz bir gösterime sahip değildir.
Artık hatırlamamam için daha fazla sebep olabilir.