Top.Mail.Ru
Ответы

Кто такой этот ваш DimaTorzok? Субтитры сделал DimaTorzok

Почему при использовании распознавания голоса в телеграм (и не только) то можно наткнутся на какого DimaTorzok. Чаще всего там написано что-то типо "Субтитры создавал/сделал/ предоставил DimaTorzok" При этом эту фигню можно встретить не только в телеграме, но и на рандомных сайтах которые хоть немного связаны с распознаванием речи. Вот моя подборка фотографий с упоминанием DimaTorzok

Даже у меня получилось вызвать этого DimaTorzok в своём голосовом сообщении.

И теперь спрашивается кто это такой и почему он может появится абсолютно везде где присутствует распознавание речи? Неужели вся речь распознаётся у какой-то одной системы распознавания речи и у неё есть такой баг и большинство компании просто установили её в свои приложения и сайты? Субтитры сделал DimaTorzok

По дате
По Рейтингу
Аватар пользователя
Новичок

Это явление наблюдается при использовании модели преобразования речи в текст Whisper от OpenAI. Чаще всего "DimaTorzok" встречается, когда модель обрабатывает аудиофрагменты с шумом или низкого качества, когда выставлен русский язык в настройках обработки. В целом, модель эффективно расшифровывает речь на многих языках и может быть запущена на ПК с видеокартой Nvidia 30 или 40 серии. Альтернативных моделей, обладающих аналогичными возможностями, практически нет или их очень мало, поэтому

"вся речь распознаётся у какой-то одной системы распознавания речи и у неё есть такой баг и большинство компании просто установили её в свои приложения и сайты",

потому что не надо изобретать велосипед, а скачал модель и погнал, ибо бесплатно

Пример использования модели Whisper Large v3 с Silero VAD, где из-за шумного аудио "DimaTorzok" встречается часто

P.S: Почему DimaTorzok? Может быть, когда-то действительно был такой дядька, который делал субтитры и это попало в датасет обучения

Аватар пользователя
Знаток

это короче этот как его
субтитры сделал DimaTorzok

Аватар пользователя
Ученик

вы все спрашивайте кто это кто это а спросить у него лично?

Аватар пользователя
Гуру
11мес

Думаем

Аватар пользователя
Ученик

Простым языком это кодовое слово которое пишется когда нейросеть в госовом файле находит шумы или когда текст не удалось распознать. Честно говоря незнаю почему "Дима Тозорок" Но судя по всему один из русских разработчиков в OpenAI решил написать именно это если в голосовом собщение слышно русскую речь но её распознать тежело.