Unicode karakterleri temsil etmek için farklı şemalardır.
Her ikisi de değişken uzunluktadır - UTF-16, ortak kullanımda çoğu karakteri içeren temel çok dilli düzlemdeki (BMP) tüm karakterler için 2 bayt kullanır.
UTF-8, BMP'deki karakterler için 1 ila 3 bayt, mevcut U + 0000 ila U + 1FFFFF arasındaki Unicode karakterleri için 4'e kadar kullanır ve gerektiğinde U + 7FFFFFFF'ye kadar genişletilebilir ... ancak özellikle tüm ASCII karakterleri her biri tek bir baytta gösterilir.
Bir mesaj özeti amacıyla, özeti yeniden oluşturmaya çalışan herkes aynı seçeneği kullandığı sürece bunlardan hangisini seçtiğiniz önemli değildir.
Bu sayfaya bakınUTF-8 ve Unicode hakkında daha fazla bilgi için .
(Tüm Java karakterlerinin BMP içindeki UTF-16 kod noktaları olduğunu unutmayın; U + FFFF üzerindeki karakterleri temsil etmek için Java'da yedek çiftler kullanmanız gerekir.)