100%-я конвертация PDF в DOC
Необходимость перегнать содержимое PDF-файла во что-нибудь "редактируемое" возникла у многих. Однако универсального и удобного средства для решения такого рода задачи до сих пор не существовало. Вернее, такие инструменты есть, но каждый из них имеет свой существенный недостаток. Например, конвертеры для перевода PDF в HTML или DOC (вроде программы PDF2WORD -
www.verypdf.com) не всегда корректно преобразовывают документы и особенно отвратительно работают с кириллицей. А вот еще один конвертер, PDF Converter 2 компании Scansoft, хотя и рекомендуют на некоторых форумах, но он не слишком распространен - скачать его можно только с warez-сайтов или купить на официальном. Поэтому об эффективности этой софтины трудно сказать что-то конкретное. Еще один способ заполучить и отредактировать содержимое PDF-файла - это открыть файл в Acrobat Reader и воспользоваться инструментом "Text Select Tool". С его помощью удастся выделить нужный кусок текста, скопировать в буфер обмена и вставить в текстовый редактор. Но такой фокус пройдет только в случае, когда PDF имеет так называемый "текстовый слой", а иначе "кина не будет".
Для меня решение данной проблемки пришло весьма неожиданно. В свое время с удивлением обнаружил, что если известной распознавалке текстов ABBYY FineReader подсунуть не изображения со сканера, а PDF-файл, то программа успешно справится с ним. И никакого больше конвертора не понадобится. Но вот совсем недавно ABBYY решила выделить эту полезную возможность в отдельную программу - ABBYY PDF Transformer 1.0. В основе ее работы также лежит система оптического распознавания символов (OCR), благодаря чему новинка способна работать со ВСЕМИ (!) типами PDF-файлов. Еще одной важнейшей особенностью программы является ее способность полностью сохранять форматирование исходного документа: таблицы, картинки, колонки и заголовки.
Как и в FineReader, в настройках этой программы для повышения точности распознавания необходимо указать примерное разрешение исходного документа (в dpi), а также используемый в документе язык. Если необходимо преобразовать не весь текст, а лишь несколько страниц, то это можно также здесь указать. PDF Transformer корректно работает с нестандартными кодировками и, как положено истинно российской программе, с кириллицей. Результат работы, в зависимости от пожеланий, либо сразу открывается в Word или Excel, либо сохраняется в виде DOC-, RTF-, XLS-, HTML-, TXT-файлов. Для обработки PDF-файлов, защищенных паролем, необходимо указать пароль.
Запускать PDF Transformer можно и другим способом. При инсталляции программа интегрируется с установленными на компьютере Word и Excel, добавляя в них свою кнопку.
В общем, просто великолепный инструмент. Но в ходе тестирования обнаружились некоторые недостатки программы. Прежде всего, это отсутствие возможности пакетной обработки файлов - не получится указать папку с PDF-файликами и пойти спокойно пить кофе. Как говорится, в очередь, ребята, в очередь! Также не упадите от неожиданности, увидав размер программы - он составляет 41 Mб. Диалап здесь не больно поможет.
Программа PDF Transformer не бесплатна, но дешевле FineReader'а почти в 4.5 раза (вот он - маркетинговый ход ABBYY).