Это явление наблюдается при использовании модели преобразования речи в текст Whisper от OpenAI. Чаще всего "DimaTorzok" встречается, когда модель обрабатывает аудиофрагменты с шумом или низкого качества, когда выставлен русский язык в настройках обработки. В целом, модель эффективно расшифровывает речь на многих языках и может быть запущена на ПК с видеокартой Nvidia 30 или 40 серии. Альтернативных моделей, обладающих аналогичными возможностями, практически нет или их очень мало, поэтому
"вся речь распознаётся у какой-то одной системы распознавания речи и у неё есть такой баг и большинство компании просто установили её в свои приложения и сайты",
потому что не надо изобретать велосипед, а скачал модель и погнал, ибо бесплатно
Пример использования модели Whisper Large v3 с Silero VAD, где из-за шумного аудио "DimaTorzok" встречается часто
P.S: Почему DimaTorzok? Может быть, когда-то действительно был такой дядька, который делал субтитры и это попало в датасет обучения
