Öncelikle: başlığınız / d ANSI kullanıyor, metinde ASCII'ye atıfta bulunuyorsunuz. Lütfen ANSI'nin ASCII'ye eşit olmadığını unutmayın. ANSI, ASCII setini içerir. Ancak ASCII seti ilk 128 sayısal değerle (0 - 127) sınırlıdır.
Tüm verileriniz ASCII (7 bit) ile sınırlandırılmışsa, hem ANSI hem de UTF-8 tam ASCII setini anlamadığından UTF-8, ANSI veya ASCII kullanmanız önemli değildir. Başka bir deyişle: 0'a kadar olan ve 127'yi kapsayan sayısal değerler ASCII, ANSI ve UTF-8'de aynı karakterleri temsil eder.
ASCII setinin dışındaki karakterlere ihtiyacınız varsa, bir kodlama seçmeniz gerekir. ANSI kullanabilirsiniz, ancak daha sonra tüm farklı kod sayfalarının sorunlarıyla karşılaşırsınız. A makinesinde bir dosya oluşturun ve B makinesinde okuyun, bu makineler farklı kod sayfalarını kullanmak için ayarlandıysa komik görünümlü metinler üretebilir / üretebilir, çünkü nnn sayısal değeri bu kod sayfalarındaki farklı karakterleri temsil eder.
Bu "kod sayfası cehennemi" Unicode standardının tanımlanmasının nedenidir . UTF-8 sadece bu standardın tek bir kodlamasıdır, çok daha fazlası vardır. UTF-16, Windows için yerel kodlama olduğu için en yaygın kullanılanıdır.
Öyleyse, ASCII setinin 128 karakterinin ötesindeki herhangi bir şeyi desteklemeniz gerekiyorsa, tavsiyem UTF-8 ile gitmektir . Bu şekilde farketmez ve kullanıcılarınızın sistemlerini hangi kod sayfasında kurdukları konusunda endişelenmenize gerek yoktur.