Скільки важить один символ в UTF-32?

У кодуванні unicode на кожен символ відводиться 2 байти.

П’ятий і шостий байти Спочатку кодування UTF-8 допускало використання до шести байтів для кодування одного символу, проте в листопаді 2003 року стандарт RFC 3629 заборонив використання п’ятого і шостого байтів, а діапазон кодованих символів був обмежений символом U+10FFFF .

Один символ кодування UTF-16 представлений послідовністю двох байтів або двох пар байтів.

Related Posts