Информатика 10 класс
Корейский текст целиком состоит из символов, кодирующихся в UTF-8 тремя байтами, а в кодировке UTF-16 двумя байтами.
Все символы файла — это корейские буквы.
Если сохранить этот текст в кодировке UTF-16, он займёт 4 Мбайт.
Сколько тот же файл займёт места, если сохранить его в других UTF-кодировках?
UTF-8:
МБ
UTF-32:
МБ
Позови битиес они придут на помощь
Исходные данные:
Корейский текст состоит из символов, которые:
В UTF-8 кодируются 3 байтами.
В UTF-16 кодируются 2 байтами.
Размер текста в кодировке UTF-16 = 4 Мб.
Расчеты:
Количество символов:
Обозначим количество символов в тексте как ‘n’.
Размер текста в UTF-16 = n * 2 байта = 4 Мб.
Переведём 4 Мб в байты: 4 Мб = 4 * 1024 * 1024 байта = 4194304 байта.
Значит, n * 2 байта = 4194304 байта.
Следовательно, количество символов n = 4194304 / 2 = 2097152 символа.
Размер текста в UTF-8:
Размер текста в UTF-8 = n * 3 байта = 2097152 * 3 байта = 6291456 байта.
Переведём 6291456 байт в мегабайты: 6291456 байта / (1024 * 1024 байта/Мб) = 6 Мб.
Таким образом, текст в UTF-8 займёт 6 Мб.
Размер текста в UTF-32
UTF-32 кодирует каждый символ 4-мя байтами.
Размер текста в UTF-32 = n * 4 байта = 2097152 * 4 байта = 8388608 байта
Переведём 8388608 байт в мегабайты: 8388608 байта / (1024 * 1024 байта/Мб) = 8 Мб.
Таким образом, текст в UTF-32 займёт 8 Мб.
Ответ:
UTF-8: 6 МБ
UTF-32: 8 МБ