потому что 1 байт может кодировать максимум 256 символов. В русском алфавите 33 буквы + 33 маленьких, в английском - 26+26 + цифры + знаки препинания, иногда в одном тексте нужны ещё греческие или, немецкие умляуты или ещё китайский упрощённый.
Всё в таблицу 256 символов не помещается.
Чтобы у всех всё одинаково читалось, придумали Unicode - 16-битную кодировку.
http://ru.wikipedia.org/wiki/Юникод в старых форматах файлов использовали переключение кодовых страниц, коих наплодилось великое множество,
например для русского только широко распространённых 3 - KOI8, CP866, CP1251.
а если в файле явно не указано, какая страница используется, получается билиберда, например:
Ñ÷åò â ïðèëîæåíèè, ñðîê ïîñòàâêè 4 íåäåëè ïîñëå îïëàòû ñ÷åòà . Äîñòàâêà äî ã. Åêàòåðèíáóðã ÷åðåç ÀÊ Àâòîòðåéäèíã, Ãðóçîâîçîôô çà ñ÷åò ïîêóïàòåëÿ