5-bit baudot kodlarıyla birçok erken çalışma yapıldı , ancak bunlar hızlı bir şekilde sınırlandı (sadece 32 olası karakter, temelde sadece büyük harfler ve birkaç noktalama işareti, ancak rakamlar için yeterli "boşluk") .
Oradan, birkaç makine 6-bit karaktere gitti. Bu yine de oldukça yetersizdi - büyük ve küçük harf (İngilizce) harfler ve rakamlar istiyorsanız, noktalama işaretleri için yalnızca iki karakter daha bıraktıysanız, çoğu hala bir karakter kümesinde yalnızca bir harf harfine sahipti.
ASCII, 7 bitlik bir karakter seti tanımladı. Bu, uzun süredir birçok kullanım için "yeterince iyi" idi ve en yeni karakter kümelerinin temelini de oluşturdu (ISO 646, ISO 8859, Unicode, ISO 10646, vb.)
İkili bilgisayarlar tasarımcıları iki boyutta güç üretmeye motive eder. "Standart" karakter seti zaten 7 bit gerektirdiğinden, 2 güç elde etmek için bir bit daha eklemek zor değildi (ve o zamana kadar depolama çoğu karakter için "boşa" biraz daha ucuz hale geliyordu. de daha kabul edilebilirdi).
O zamandan beri, karakter kümeleri 16 ve 32 bitlere taşındı, ancak çoğu ana bilgisayar büyük ölçüde orijinal IBM bilgisayarına dayanıyor. Sonra yine, pazarın yeterince 8 bitlik karakterden yeterince memnun kaldığı, PC'nin şu anki baskınlık seviyesine ulaşmasa bile, herkesin her şeyi daha büyük karakterlerle yapabileceğinden emin değilim.
Pazarın biraz değiştiğini de eklemeliyim. Mevcut pazarda, karakter boyutu donanım tarafından yazılımdan daha az tanımlanır. Windows, Java vb. Uzun zaman önce 16 bit karakterlere taşındı.
Şimdi, 16 veya 32 bit karakterleri desteklemedeki engel, yalnızca 16 veya 32 bit karakterlerin kendisinde olan zorluklardan ve çoğunlukla genel olarak i18n'yi desteklemenin zorluklarından kaynaklanmaktadır. ASCII'de (örneğin) bir harfin büyük mü yoksa küçük harf mi olduğunun veya ikisinin arasında dönüştürülmesinin inanılmaz derecede önemsiz olduğunu tespit etmek. Tam Unicode / ISO 10646'da temel olarak tarif edilemez şekilde karmaşıktır (standartların bile denemediği bir noktaya kadar - tabloları değil açıklamaları verir). Sonra bazı diller / karakter kümeleri için, büyük / küçük harf temel fikrinin bile geçerli olmadığını da eklersiniz . Sonra, bazılarında karakterleri göstermenin bile, hala çok daha karmaşık olduğunu ekliyorsunuz.
Bunların hepsi, yazılımın büyük çoğunluğunun bile denemediği kadar karmaşık. Durum yavaş yavaş iyileşiyor, ancak yavaş yavaş operasyonel kelime.