Mail.ruПочтаМой МирОдноклассникиВКонтактеИгрыЗнакомстваНовостиКалендарьОблакоЗаметкиВсе проекты

Обучение нейросети по распознаванию рукописного текста на русском

Test Pochta Ученик (129), на голосовании 1 год назад
Я пытаюсь написать нейросеть для распознавания рукописного текста на русском языке по фото. За основу взял статью на Хабре ( https://habr.com/ru/articles/720614/ ) и соответственно код с гитхаба ( https://github.com/CyberLympha/Examples/blob/main/CV/CRNN_for_IAM.ipynb ). Однако в этих примерах используется датасет IAM для английского языка, а доступ к HKR например я получить к сожалению не могу. Решил написать свой скрипт для генерации датасета, взял 2 рукописных шрифта, подключил словарь русского языка и наклипал 7200 изображений (в каждом пнг по 5 слов). При обучении параметр loss постоянно повышен и не может опуститься даже ниже 90.5. Я уже многое менял, включая скорость обучения, размер входных пакетов и параметры в callback'ах, но всё тщетно. Не могу понять, почему нейронка с датасетом, настолько схожий на IAM, не может также быстро и точно обучиться. Пробовал и оставлять один прописной шрифт и менять количество слов в одной картинке, но проблема остаётся той же. Что делать?
Голосование за лучший ответ
Джо Ленон Искусственный Интеллект (244809) 1 год назад
Так устроит?
Конечно, я могу помочь тебе с обучением нейросети по распознаванию рукописного текста на русском языке. Для этого потребуется следующий набор шагов: 1. Сбор и подготовка данных: Необходимо получить набор образцов рукописного текста на русском языке. Это может быть набор изображений букв и цифр, которые будут использоваться для обучения нейросети. 2. Предобработка данных: Изображения рукописного текста нужно привести к одному формату, например, к черно-белым изображениям с фиксированным размером. Также можно провести нормализацию данных, чтобы улучшить качество обучения. 3. Создание модели нейросети: Выбери тип нейронной сети для обучения распознаванию рукописного текста. Можно использовать сверточные нейронные сети, рекуррентные нейронные сети или комбинацию обоих. 4. Обучение модели: Разделите данные на обучающую, тестовую и валидационную выборки. Затем обучай модель на обучающей выборке, используя методы градиентного спуска и обратного распространения ошибки. Оптимизируй гиперпараметры модели, чтобы достичь оптимальной точности распознавания. 5. Тестирование и оценка модели: Проверь производительность обученной модели на тестовой выборке. Оцени точность распознавания рукописного текста и доработай модель при необходимости. 6. Деплой и использование модели: После успешного тестирования модели, используй ее для распознавания рукописного текста на новых данных. Это общий план действий. Для каждого шага могут потребоваться дополнительные детали и настройки в соответствии с твоими конкретными требованиями. Если ты хочешь более подробную
Татьяна Шеховцова Высший разум (532330) 1 год назад
5 слов? Много. Рукописному учат сначала по 1 символу
Похожие вопросы