Mail.ruПочтаМой МирОдноклассникиВКонтактеИгрыЗнакомстваНовостиКалендарьОблакоЗаметкиВсе проекты

Кто такой этот ваш DimaTorzok? Субтитры сделал DimaTorzok

Brat Bay Мастер (1572), закрыт 1 год назад
Почему при использовании распознавания голоса в телеграм (и не только) то можно наткнутся на какого DimaTorzok. Чаще всего там написано что-то типо "Субтитры создавал/сделал/ предоставил DimaTorzok" При этом эту фигню можно встретить не только в телеграме, но и на рандомных сайтах которые хоть немного связаны с распознаванием речи. Вот моя подборка фотографий с упоминанием DimaTorzok Даже у меня получилось вызвать этого DimaTorzok в своём голосовом сообщении. И теперь спрашивается кто это такой и почему он может появится абсолютно везде где присутствует распознавание речи? Неужели вся речь распознаётся у какой-то одной системы распознавания речи и у неё есть такой баг и большинство компании просто установили её в свои приложения и сайты? Субтитры сделал DimaTorzok
Лучший ответ
jidkost' Знаток (287) 1 год назад
Это явление наблюдается при использовании модели преобразования речи в текст Whisper от OpenAI. Чаще всего "DimaTorzok" встречается, когда модель обрабатывает аудиофрагменты с шумом или низкого качества, когда выставлен русский язык в настройках обработки. В целом, модель эффективно расшифровывает речь на многих языках и может быть запущена на ПК с видеокартой Nvidia 30 или 40 серии. Альтернативных моделей, обладающих аналогичными возможностями, практически нет или их очень мало, поэтому
"вся речь распознаётся у какой-то одной системы распознавания речи и у неё есть такой баг и большинство компании просто установили её в свои приложения и сайты",
потому что не надо изобретать велосипед, а скачал модель и погнал, ибо бесплатно

Пример использования модели Whisper Large v3 с Silero VAD, где из-за шумного аудио "DimaTorzok" встречается часто

P.S: Почему DimaTorzok? Может быть, когда-то действительно был такой дядька, который делал субтитры и это попало в датасет обучения
TemurМастер (1595) 3 месяца назад
 потому что не надо изобретать велосипед, а скачал модель и погнал, ибо бесплатно 
Вот только сам телеграм эту фичу преподносит за шекели и совсем не бесплатно, рыночек порешал
irmichЗнаток (283) 2 месяца назад
Угадайте где ещё я увидел Диму Торзока?...
Остальные ответы
Ростислав Ямов Знаток (253) 1 год назад
это короче этот как его
субтитры сделал DimaTorzok
Тип НекийУченик (164) 7 месяцев назад
хахах
neomajertite Профи (803) 1 год назад
человек который придумал такие субтитры
Anonymous Anonymous Ученик (184) 1 год назад
вы все спрашивайте кто это кто это а спросить у него лично?
Егор ГуртовойПрофи (739) 3 месяца назад
что он забыл в моём локальном whisper large
Контент На детяхУченик (149) 3 месяца назад
А можно его контакты? Так-то не каждый у него лично спросит
Anonymous Anonymous Ученик (184) Контент На детях, раньше можно было, сейчас его тэг либо забрали либо он сам сменил
джей декадансовУченик (105) 2 месяца назад
ебонтизм
Игорь ОзнобихинУченик (244) 2 месяца назад
Дневник, выход...
Noah Grey Ученик (109) 1 год назад
Простым языком это кодовое слово которое пишется когда нейросеть в госовом файле находит шумы или когда текст не удалось распознать. Честно говоря незнаю почему "Дима Тозорок" Но судя по всему один из русских разработчиков в OpenAI решил написать именно это если в голосовом собщение слышно русскую речь но её распознать тежело.
doxyvoki02 Знаток (274) 2 месяца назад
субтитры сделал DimaTorzhok
test user Ученик (104) 1 месяц назад
В общем, наткнулся на Диму ̶У̶т̶к̶и̶н̶а̶ Торжка когда гонял локально openAI whisper. Удивился и пошел искать что же это такое. В общем: насколько я правильно понял - модель whisper обучалась на множестве роликов на YouTube, которые содержат ручные субтитры(которые делал человек). Видать DimaTorzhok в конце или начале видео, либо когда в видео нет звука, писал свое авторство. Собственно, модель приравняла тишину или шум к тексту "субтитры сделал DimaTorzhok". Почему модель от этого не почистили - я не знаю. В начале моей записи, расшифровку которой я хотел получить, как раз слышен шум порядка 1 минуты, оттуда и вылез Димон. Забавно!
Похожие вопросы