Почему текст файла PDF Adobe Acrobat Reader распознаёт как картинку, а не как текст

Question

Не удается скопировать текст т.к. программа распознаёт страницы как картинку, а не как текст. Можно ли это как-то исправить? Может переформатировать нужно? Спасибо!

user_109191040 · Accepted Answer

Зависит от того, как и в какой программе был создан файл PDF.
В "правильном" PDF текст и изображения структурированы отдельно, но во многих случаях PDF создаётся из отсканированных изображений, следовательно, весь контент такого PDF представляет из себя картинки.
В данном случае можно попробовать пропустить PDF-файл через ABBYY FineReader или аналогичную программу.

lionidych · Answer

Так и должно быть. PDF файлы всегда состоят из картинок, они же фото. Чтобы текст из картинки, превратился в текстовый файл, его нужно распознать в FineReader

vlad_sergeev_1206 · Answer

потому что скан, сохранённый в .pdf...

uncle_c · Answer

...потому, что это ФОТОГРАФИЯ страницы.
надо пропустить эту фотографию через распознаватель текста
OCR

denis_13947 · Answer

значит файл содержит не текст, а картинки. такое частенько встречается.