Распознование формул
Как распознать картинки(сканированный учебник) в котором есть формулы и обычный текст (сборник задач по физике) в простой текст(формулы можно просто картинки, FineReader превращает формулы в какуе то х...
Нужно подкачать словарей специализированных для ридера
Есть сервис - на сайте mtscript точка ru (в меню MT-Recognition) /mathrec/service/ru, который как раз распознает и текст на множестве языков и формулы (причем очень корректно). Языки с латинскими символами распознаются как с печатных оригиналов, так и с рукописных. Рукописные формулы также великолепно распознаются. Кириллица - только печатная.
Распознаются ВСЕ математические формулы просто за секунды + весь текст вокруг. Набирать ничего не нужно. Все автоматически и очень качественно. Можете не верить, но нейронные сети уже просто творят чудеса. Сам сейчас распознаю книги по математике и физике за пару часов. Да, потом несколько дней вычитываю и правлю ошибки, а раньше на это уходили месяцы.
Логика следующая. Вы получаете текст + формулы в Tex. Копируйте это все в Word и командой MathType-> Toogle Tex делаете из формул в таком формате $ { x } ^ { 2-z } $ привычную формулу MathType, как будто Вы ее лично набрали. Минута делов, к счастью.
Почитай справку по Файнридеру и прежде чем распозновать выдели формулы как картинки, он их картинками и оставит! Ты просто не умеешь правильно пользоваться Файнридером, все он правильно распознает, только ему сказать нужно, что от него хотят!
Выделяйформулы как изображение.. . Потом, чтобы не было фона отсканированной страницы, "Свойства изображения" - "Черно-белый"...