Kaynak koddaki alıntı dizelere veya karakterlere düz metin yazabilmek ve gerçek karakteri görebilmek çok güzel. Örneğin, pi sembolü 'π' veya '𠀊' ideografı, pi için '\ u3c0' ve ideografi için L '\ u2000A' eşdeğerinden çok daha hoştur.
Bu karakterleri tıpkı ASCII karakterlerinde olduğu gibi doğrudan bir kaynak koduna yazmak ve / veya kopyalayıp yapıştırmak iyi bir düzenleyicide mümkündür.
Kelime açıklamalarının bazen eve gitmediği şeyleri kavramsallaştırma ve anlamada somut örnekler buluyorum. Aşağıdaki kısa örnek kod snippet'i gibi kaynak koduna yazılan Unicode karakter sabitlerini kavramsallaştırın:
const unsigned char ASCII_0X7E = (unsigned char) '~';
const unsigned short UNICODE_0X3C0 = (unsigned short) 'π';
const unsigned long UNICODE_0X2000A = (unsigned long) '𠀊';
const unsigned long UNICODE_0X2893D = (unsigned long) '𨤽';
ASCII tilde karakteri '~' ASCII veya UTF-8 kaynak dosyasına kaydedilebilir, ancak Unicode karakterleri ASCII biçiminde saklanamaz. 'Π' PI sembolü Unicode kod noktası 0x3c0'dır ve UTF-8 biçiminde iki bayt değeri 0xcf, 0x80 olarak saklanabilir. Unicode kod noktalarındaki İdeograflar, 0x2000a ve 0x2893d noktalarını 4 bayt UTF-8 dizileri gerektirir.
Bu karakterlerin amaçlanan değerlerini koruyabilmesi ve derleyicinin amaçlandığı şekilde yorumlayabilmesi için, kaynak kodun UTF-8 veya UTF-16 gibi Unicode karakter kümesini destekleyen bir biçimde kaydedilmesi gerekir. UTF-8 olarak kaydedildiyse, iyi bir derleyici amaçlandığı gibi değerleri anlayacak ve yorumlayacak ve iyi bir düzenleyici karakterleri düzgün bir şekilde yükleyecek ve görüntüleyecektir.
Diğerlerinin işaret ettiği gibi, kaynak kodunuzda ASCII aralığının dışında herhangi bir karakter yoksa, UTF-8 olarak kaydetmek, UTF- Şekil 8, ASCII karakter aralığındaki ASCII ile çakışacak şekilde tasarlanmıştır. Kaynak kodunuza ASCII aralığının dışındaki herhangi bir karakteri yazar yazmaz, iyi bir editör dosyayı kaydetmek için kullanmak üzere bir kodlama seçmeniz gerektiğini bildirecektir. UTF-8 iyi bir seçimdir çünkü ASCII'yi olduğu gibi ve geliştirme ortamınızda desteklenen hemen hemen her karakteri işleyebilir.