Bir evcil hayvan eşim, karakter kümesi desteği için kod dağları bulunan birçok yazılım projesine bakıyor. Beni yanlış anlamayın, ben tamamen uyumluluk için varım ve metin editörlerinin dosyaları birden çok karakter setinde açmanıza ve kaydetmenize izin vermesinden memnunum Beni rahatsız eden şey, evrensel olmayan karakter kodlamalarının çoğalmasının “sorun” değil, “uygun Unicode desteği” olarak etiketlenmesidir.
Örneğin, PostgreSQL ve karakter seti desteğini seçmeme izin verin . PostgreSQL iki tip kodlama ile ilgilenir:
- İstemci kodlaması: İstemci ile sunucu arasındaki iletişimde kullanılır.
- Sunucu kodlaması: Metni dahili olarak veritabanında saklamak için kullanılır.
Neden çok sayıda müşteri kodlamasını desteklemenin iyi bir şey olduğunu anlayabiliyorum. UTF-8'de çalışmayan müşterilerin, dönüşüm gerçekleştirmeye gerek kalmadan PostgreSQL ile iletişim kurmasını sağlar. Ne anlamadım: PostgreSQL neden birden çok sunucu kodlamasını destekliyor ? Veritabanı dosyaları (neredeyse her zaman) bir PostgreSQL sürümünden diğerine uyumsuzdur, bu nedenle çapraz sürüm uyumluluğu burada sorun değildir.
UTF-8, tüm Unicode kod noktalarını kodlayabilen tek standart, ASCII uyumlu karakter setidir (yanılıyorsam bana bildirin). UTF-8'in en iyi karakter kümesi olduğu kampındayım , ancak UTF-16 ve UTF-32 gibi diğer evrensel karakter setlerine katılıyorum.
Tüm evrensel olmayan karakter setlerinin kullanımdan kaldırılması gerektiğine inanıyorum. Olmaması için zorlayıcı bir sebep var mı?