Удачник
Высший разум
(142018)
6 лет назад
По таблицам кодов.
Давным давно, в MS DOS, была таблица ASCII.
Русская страница в ней имела код OEM-866.
Потом в Windows появилась таблица ANSI.
Русская страница имела код 1251.
Кроме того, есть еще альтернативные кодировки:
KOI-8, MAC, EBCDIC, GOST и другие, ныне уже забытые.
Во всех этих таблицах каждый знак занимает 1 байт, код от 0 до 255. Всего 256 знаков, что очень мало. Поэтому эти таблицы разбивают на разные кодовые страницы, для русского, греческого, арабского, иврита и других алфавитов.
А потом появился Unicode и его модификации Utf-7 и Utf-8.
В них каждый знак занимает 2 байта, код от 0 до 65535.
Этого уже хватает на все основные языки, даже на китайские и японские иероглифы.