У кодуванні unicode на кожен символ відводиться 2 байти.
П’ятий і шостий байти Спочатку кодування UTF-8 допускало використання до шести байтів для кодування одного символу, проте в листопаді 2003 року стандарт RFC 3629 заборонив використання п’ятого і шостого байтів, а діапазон кодованих символів був обмежений символом U+10FFFF .
Один символ кодування UTF-16 представлений послідовністю двох байтів або двох пар байтів.