Избыточность — термин из теории информации, означающий превышение количества информации, используемой для передачи или хранения сообщения, над его информационной энтропией. Для уменьшения избыточности применяется сжатие данных без потерь - ссылка по теме
http://www.gramota.ru/biblio/magazines/gramota/russianworld/28_140 русский яз Например, в русском языке после символа «Ъ» не может идти символ согласного звука. После двух подряд гласных «Е» третий гласный «Е» следует крайне редко (например, в слове «длинношеее») . Таким образом, каждый следующий символ в некоторой степени предопределен, поэтому можно говорить об условной энтропии символа.
Согласно Ерохину («Теория информации. Часть 1.») избыточность русского языка составляет 73%, избыточность французского языка равна 71%, немецкого — 66%. Наибольшей избыточностью обладают «специальные языки» , например язык «диспетчеров аэропорта» или язык юридических документов, менее избыточным является литературный язык, еще менее избыточным — живая речь. Например, для русского языка: живая речь: 72 %; литературный текст: 76%; юридический текст: 83%. Эти данные можно дополнить сравнением русского и французского языка:
Русский язык
Французский язык
Язык в целом
72,6%
70,6%
Разговорная речь
72,0%68,4%
Литературный текст
76,2%71,0%
Деловой текст
83,4%
74,4%
В частности, на каких языках нужно произнести наименьшее количество слогов, чтобы передать относительно сложную мысль (одну и ту же)?
И еще вопрос: при переводе на какие языки (кроме тех, что используют иероглифы) один и тот же не слишком сложный текст будет иметь наименьший объем?
Мне кажется, что теоретически гораздо меньшей избыточностью должны обладать языки с большим количеством букв и звуков, а также с наиболее разнообразной сочетаемостью и более-менее равномерной частотой употребления основных элементов (буквы, звуки, слоги, односложные слова и т.п.).
Так, в русском языке букв намного больше, чем в английском, но наша грамматика удлинняет слова и ограничивает сочетаемость букв / звуков, так что русский более избыточен. В турецком и венгерском граматика еще менее рациональна, а в центральном ротокасском (см. в Википедии) очень мало основных элементов.