MySQL Harmanlama utf8_unicode farklılıkları


10

Ama MySQL Harmanlamanın önemini okudum ve şu ana kadar uyumluluk ve doğruluk hakkında öğrendiklerim, bu 4 en iyi bahisim gibi görünüyor.

  • utf8_unicode_ci
  • utf8_unicode_520_ci
  • utf8mb4_unicode_ci
  • utf8mb4_unicode_520_ci

Benim anlayışımdan uft8mb4 mutli dil (karakter) desteği olan karakter için iyi olurdu (örneğin japonca). uf8mb4 4 baytı desteklerken uf8 sadece 3 baytı destekler. Bu yüzden bariz seçim uf8mb4 gibi görünüyor, ama yakalama bir uzunluk sınırınız var gibi görünüyor (Lanet olsun! Ben pasta istiyorum ve yemek de), bu biraz endişe (sanırım).

O zaman 520 standardını dikkate alırsınız; bu da daha az şey sunabiliyor. Ama elbette mesele bu, bu konuda çok az şey bulabilirdim. Sadece insanlar bunun bir gelişme olduğunu söylüyor, ancak bunun nasıl olduğu konusunda çok belirsiz.

Mümkün olduğunca az kısıtlamayla alabileceğim en iyisini istiyorum ... Burada birinin bir ya da iki şey bildiğini düşündüm. Resmi MySQL sitesi, umduğum kadar bilgilendirici değildi.

En çok uyumluluk, doğruluk ve en uzun depolama uzunluğunu sunan 4 modelden hangisi? Ayrıca 502 standardı arasındaki büyük fark gerçekten nedir?

Yanıtlar:


10

Unicode harmanlama adları, harmanlamanın dayandığı Unicode Harmanlama Algoritmasının (UCA) sürümünü belirten bir sürüm numarası içerebilir. Adına sürüm numarası olmadan TDM temelli alfabe kullanmak UCA ağırlık anahtarları . Gibi bir harmanlama adı UCA 5.2.0 ağırlık anahtarlarına dayanmaktadır .version-4.0.0utf8_unicode_520_ci

Bkz. Https://dev.mysql.com/doc/refman/5.6/tr/charset-collation-names.html .


Bunu daha fazla açıklamak için: harmanlama, kullanılan kodlamayı değiştirmez (MySQL'in yanlış çağırdığı character setveya charset), bu nedenle utf8size 3 baytlık (standart olmayan) UTF-8 ve utf8mb44 baytlık UTF-8 sağlayacaktır.
jynus

1
Yani basit İngilizce'de UCA 4.0.0 ve UCA 5.2.0 arasındaki farkın ne olduğu daha yeni. Avantaj veya dezavantaj ne olurdu?
Adam

4
Sıralamayı etkiler. Unicode standardının daha yeni (ama yine de güncel olmayan) bir sürümüne karşı sıralama yapmanız gerekiyorsa, o zaman kullanmak isteyebilirsiniz 520_ci. Web sitelerim için daha az umursamadım.
Mathias Bynens

utf8mb4_unicode_520_ciharmanlamadaki en büyük bayt boyutu karakterinin bayt boyutu nedir?
oldboy
Sitemizi kullandığınızda şunları okuyup anladığınızı kabul etmiş olursunuz: Çerez Politikası ve Gizlilik Politikası.
Licensed under cc by-sa 3.0 with attribution required.