Önceki cevap olarak karakter seti, bir sayıya atanan bir karakter dizisidir (harfler, sayılar, ideogramlar vb.); Onları görebilmek için fontun (okuduğumuz küçük "resimler") olması gerekir. LatinX kullanarak önemliydi, çünkü her X için aynı sayı (byte) farklı bir karaktere atıfta bulunabilirdi.
Günümüzde kodlamanın seçilmesi daha önemlidir: standart, Unicode'un (ASCII ile uyumlu ancak tüm dilleri, hatta Çince ve Japonca'yı da içerecek kadar esnek) ve W3C standardını kapsayacak şekilde en başarılı temsili olan UTF-8'dir. Başka bir deyişle, tüm karakter kümelerini içerir.
Harmanlama: Bu Latince'den türetilmiş eski moda bir kelimedir. Bu, şu anlama gelir: farkları (hataları veya değişiklikleri) bulmak için bir kopyasını (el yazısıyla) orijinaliyle karşılaştırın. Geçmişte çok faydalı oldu, ama şimdi neredeyse bir arkaik olmadı çünkü belgelerimiz ve kitaplarımız bilgisayarlar kullanılarak yazılmış ve kopya her zaman orijinaliyle aynı. Örnek: İtalyancada (latince türetilmiş) "collazionare" fiili var, ancak sözlüklerde var ve kimse bunu kullanmıyor.
Dolayısıyla, harmanlama, karşılaştırma işleçlerinin davranışını tanımlar: =,>, <, <=,> = ...
Elbette bu operatörler iki dizginin aynı olup olmadığına veya bir kelimenin diğerinden daha büyük olup olmadığına karar vermek için kullanılır, sıralamak istiyorsak çok önemlidir. Harfler her dil için aynı sırada değildir, bu nedenle bir harmanlama kullanarak bir sözcük diğerinden daha büyük olabilir, ancak başka bir dil kullanamaz. Pratik bir örnek için [1] e bakınız.
"bin" harmanlamaları en katıdır: SELECT "b" = "B" => YANLIŞ
"ci" harmanlamaları büyük / küçük harfe duyarlı değildir: SELECT "b" = "B" => TRUE
"general" bazı farklılıkları görmezden gelir: SELECT "a" = "à" => TRUE
diğer bir veya daha fazla dil için özeldir. Örnek "İsveççe" (İsveççe'nin neden genellikle varsayılan olduğunu bilmiyorum)
Hala her harmanlamanın davranışının ayrıntılı olarak açıklandığı bir web sitesi arıyorum ... bu örnekler benim deneyimimden kaynaklanıyor.
[1] http://www.olcot.co.uk/sql-blogs/revised-difference-between-collation-sql_latin1_general_cp1_ci_as-and-latin1_general_ci_as