Головне, про що варто знати, це те, що, на відміну від UTF-8, GB18030 дозволяє використовувати байти ASCII у кодуванні багатобайтового символу. (Наприклад, «ß» кодується як байти 81 30 89 38, які містять кодування ASCII «0» і «8».) Це означає, що ви не можете використовувати просту функцію пошуку/індексу, орієнтовану на байт. 21 жовтня 2008 р
Кодування метарядка використовує 5/6 біт замість 8 біт у кодуванні utf-8 для кожного символу. Оскільки він використовує менше бітів, ніж utf8, він може заощадити 37,5% вартості простору порівняно з utf-8 і має менший двійковий розмір кодування, який використовує менше пам’яті та робить передачу по мережі швидшою.
Формат перетворення Юнікоду UTF-8 система кодування для Unicode. Він може перетворити будь-який символ Unicode у відповідний унікальний двійковий рядок, а також може перетворити двійковий рядок назад у символ Unicode. Це значення «UTF» або «формату перетворення Юнікоду».');})();(function(){window.jsl.dh('MR3sZr7WEPWn5NoPiIWsgAg__27','
ASCII Для символів, представлених 7-бітовими кодами символів ASCII, представлення UTF-8 точно еквівалентно ASCII, що дозволяє прозору міграцію в обидві сторони. Інші символи Unicode представлені в UTF-8 послідовностями до 6 байтів, хоча більшість західноєвропейських символів потребують лише 2 байтів3.');})();(function(){window.jsl.dh('MR3sZr7WEPWn5NoPiIWsgAg__32', '
Є кілька можливих представлень даних Юнікод, в тому числі UTF-8, UTF-16 і UTF-32. Усі вони здатні представляти весь Юнікод, але відрізняються, наприклад, кількістю бітів для складових одиниць коду.
utf8 використовувався MySQL у минулому як псевдонім для набору символів utf8mb3, але це використання тепер застаріло; у MySQL 8.4 оператори SHOW і стовпці таблиць INFORMATION_SCHEMA замість цього відображають utf8mb3. Для отримання додаткової інформації див. розділ 12.9.2, «Набір символів utf8mb3 (3-байтове кодування UTF-8 Unicode)».