Top.Mail.Ru
Ответы

Как преобразовать файл из PDF в Word без ошибок и артефактов?

Я недавно купил книгу в Литрес, по своей специальности "Строительная механика 2-е изд., пер. и доп. Учебник и практикум для СПО" от Сергея Николаевича Кривошапко. Возможности экспортирования из Литрес у конкретной книги нет, я так понял из-за запрета издателя. Поэтому я через код сайта (F12 в Хром) нашел url на каждую страницу книги и скачал все постранично, у меня появились много страниц с расширением gif, потом я всё это склеил через Adobe Acrobat и там же хотел воспользоваться функцией преобразования из PDF в Word (это нужно чтобы иметь возможность редактировать самостоятельно книгу), но получилась некрасивая куча-мала с ошибками и всем прочим.

Я попытался также сделать через другие программы таких как онлайн сервисы и Wondershare, либо сервисы просто вставляли в Word файл картинку, что нам не подходит так как я хочу иметь возможность редактирования, либо такой же ужасный результат выходил где-то больше или меньше. Я также пытался все gif страницы переконвертировать в JPG и попытаться снова, такой же результат. Очень прошу помогите как можно скорее, переконвертировать эту книгу в Word, либо, пожалуйста, укажите мне более подходящие форумы, где я бы смог задать вопрос. Заранее спасибо

По дате
По рейтингу
Аватар пользователя
Мастер
5мес

Известные мне на практике программы, умеющие PDF конвертировать в Word с удобоваримым результатом:
- PDFgear
- Adobe Acrobat
- MS Word 365
- Wondershare PDFelement
- AVS Document Converter
- Abbyy Transformer+
- Abbyy FineReader
- Nitro PDF
- Soda PDF (онлайн)

Список ранжирован по мере потери качества конвертирования. Но это не значит, что Soda самый худший. Есть и другие программы, которые в список не вошли из-за неприемлемого качества. Возможно мне что-то еще неизвестно, поэтому список не претендует на абсолютную объективность.
Подразумевается, что текст в pdf - это не картинка. В противном случае рекомендуется только Abbyy FineReader, потому что умеет хорошо распознавать текст с картинки.

Аватар пользователя
Мастер
5мес

Можно попробовать еще https://tools.pdf24.org/ru/ocr-pdf но результат вряд ли будет лучше Акробата. Текст получится если скан хороший, а вот рисунки и верстку придется делать ручками. Сизифов труд.
Но! Редактировать какую-то книгу не очень правильный подход. В PDF можно вставлять комментарии, лучше этим пользоваться. Или если загнать картинками в тот же Ворд, в нужных местах после страницы книги добавить что хочется.

Аватар пользователя
Гуру
5мес

На самом деле тут все от качества скана зависит. Оптическое распознавание всегда было лотереей.
В принципе, открывать пдф в виде текста и сам современный Ворд умеет, но качество результатов будет прямо связано с качеством исходника.

Аватар пользователя
Просветленный
5мес
Аватар пользователя
Искусственный Интеллект
5мес

А Литрес её из торрента скачал?
Из пдф можно тупо скопировать текст и сохранить картинки, если это нормальный пдф