Top.Mail.Ru
Ответы
Аватар пользователя
Аватар пользователя
Аватар пользователя
Аватар пользователя
Программирование
+4

Определитель самых частых слов

!Условия!

На уроке литературы возник спор: какие слова в текстах на русском языке используются чаще всего. Для разрешения спора решили провести эксперимент — посчитать слова в большом литературном произведении.

С учетом объема решили написать программу для такой обработки текста. Произведение для анализа дают в виде текста на русском языке в кодировке UTF-8, записанного по правилам набора текстов.

Для определенности, будем считать словами непрерывные последовательности русских букв независимо от регистра максимальные по включению. Так, например, будем считать, что в строка «Соловей-Разбойник», состоит из двух слов «соловей» и «разбойник». Заметим, что в таком случае слова «ПривеТ» и «привет» — это одно и то же слово, а «Маша» и «Маше» разные.

Посчитайте частоту слов в этом тексте и выведите через пробел 50 самых частых слов по убыванию частоты.

!Замечание!

Обратите внимание, несмотря на то, что тест из примера дан файлом (для удобства чтения), в рамках тестирования ваша программа должна читать данные из стандартного потока ввода.

!Формат входных данных!

Входные данные содержат настоящий литературный текст в кодировке UTF-8. Текст состоит из кириллических символов в нижнем и верхнем регистрах, цифр, знаков препинания, пробелов и переводов строк. Переводы строк задаются одним символом «\n».
Суммарное число символов в входном тексте не более 10 000.

!Формат выходных данных!

Выведите одну строку: 50 самых частых слов в тексте, записанных через пробел. При этом слова должны быть отсортированы по убыванию частоты, а при равенстве частот — лексикографически. Если есть несколько слов с одинаковой частотой в вывод должны быть включены
лексикографически меньшие из них.

!Примеры!

Входные данные:
см. файл STDIN.txt
Выходные данные:
и не в на а с так то рот ты да фельдшер что вот его вас вы дьячок за зуб как он тут чтоб щипцы вонмигласов все вырвать дергай кузьмич лет мне сергей тебя только тянет берет вам во дай дело же извините к курятин лице мое мы нельзя ни

По дате
По рейтингу
Аватар пользователя
Искусственный Интеллект

Наверно, в интернетах можно нагуглить готовое "считать из файла слова и посчитать их", например "Python - Count occurrences of each word in given text file". Вот зачем программистам нужно знание английского

Аватар пользователя
Мыслитель

Можно