Mail.ruПочтаМой МирОдноклассникиВКонтактеИгрыЗнакомстваНовостиКалендарьОблакоЗаметкиВсе проекты

Как скопировать текст из документа *.pdf

Роман Сафин Профи (789), закрыт 18 лет назад
напримае в Word
Лучший ответ
Вадим Бубнов Профи (632) 18 лет назад
100%-я конвертация PDF в DOC
Необходимость перегнать содержимое PDF-файла во что-нибудь "редактируемое" возникла у многих. Однако универсального и удобного средства для решения такого рода задачи до сих пор не существовало. Вернее, такие инструменты есть, но каждый из них имеет свой существенный недостаток. Например, конвертеры для перевода PDF в HTML или DOC (вроде программы PDF2WORD - www.verypdf.com) не всегда корректно преобразовывают документы и особенно отвратительно работают с кириллицей. А вот еще один конвертер, PDF Converter 2 компании Scansoft, хотя и рекомендуют на некоторых форумах, но он не слишком распространен - скачать его можно только с warez-сайтов или купить на официальном. Поэтому об эффективности этой софтины трудно сказать что-то конкретное. Еще один способ заполучить и отредактировать содержимое PDF-файла - это открыть файл в Acrobat Reader и воспользоваться инструментом "Text Select Tool". С его помощью удастся выделить нужный кусок текста, скопировать в буфер обмена и вставить в текстовый редактор. Но такой фокус пройдет только в случае, когда PDF имеет так называемый "текстовый слой", а иначе "кина не будет".

Для меня решение данной проблемки пришло весьма неожиданно. В свое время с удивлением обнаружил, что если известной распознавалке текстов ABBYY FineReader подсунуть не изображения со сканера, а PDF-файл, то программа успешно справится с ним. И никакого больше конвертора не понадобится. Но вот совсем недавно ABBYY решила выделить эту полезную возможность в отдельную программу - ABBYY PDF Transformer 1.0. В основе ее работы также лежит система оптического распознавания символов (OCR), благодаря чему новинка способна работать со ВСЕМИ (!) типами PDF-файлов. Еще одной важнейшей особенностью программы является ее способность полностью сохранять форматирование исходного документа: таблицы, картинки, колонки и заголовки.

Как и в FineReader, в настройках этой программы для повышения точности распознавания необходимо указать примерное разрешение исходного документа (в dpi), а также используемый в документе язык. Если необходимо преобразовать не весь текст, а лишь несколько страниц, то это можно также здесь указать. PDF Transformer корректно работает с нестандартными кодировками и, как положено истинно российской программе, с кириллицей. Результат работы, в зависимости от пожеланий, либо сразу открывается в Word или Excel, либо сохраняется в виде DOC-, RTF-, XLS-, HTML-, TXT-файлов. Для обработки PDF-файлов, защищенных паролем, необходимо указать пароль.

Запускать PDF Transformer можно и другим способом. При инсталляции программа интегрируется с установленными на компьютере Word и Excel, добавляя в них свою кнопку.

В общем, просто великолепный инструмент. Но в ходе тестирования обнаружились некоторые недостатки программы. Прежде всего, это отсутствие возможности пакетной обработки файлов - не получится указать папку с PDF-файликами и пойти спокойно пить кофе. Как говорится, в очередь, ребята, в очередь! Также не упадите от неожиданности, увидав размер программы - он составляет 41 Mб. Диалап здесь не больно поможет.
Программа PDF Transformer не бесплатна, но дешевле FineReader'а почти в 4.5 раза (вот он - маркетинговый ход ABBYY).
Остальные ответы
Иванов Павел Профи (738) 18 лет назад
Можно просто тупо как картинку, а можно открыть pdf файл в какой-нибудь программе распознавания текста например ABBY FineReader и снять текст как с обычного скана
Prologus Гуру (4189) 18 лет назад
FineReader, прога, это делает.
Или, если кусок небольшой, можно попытатся инструментом Adobe Reader'а. Он вроде Select называется. И это только для "прямых" текстов, т.е. которые в pdf печатали.
Odinochka Мастер (2445) 18 лет назад
установите полную версию адоб ридера, и делайте с файлами пдф чего хотите :)
Еля Мыслитель (8488) 18 лет назад
Программулина PDF2Word, любая версия
Антон Старовойтов Мастер (1935) 18 лет назад
pdf может быть распознанным, а может и не быть. Если он распознан - в Acrobat есть кнопка - выделить текст. Если не распознан - кнопка не поможет, нужно распознать, например в finereader.
Олег Баландин Гуру (4608) 18 лет назад
Делал так:
печатаешь в принтер Microsoft Office Document Image Writer
получается графический файл
через ABBYY FineReader 7.0 Professional Edition прогоняешь...

А вообще в природе существуют редакторы таких файлов и конвертеры.

Удачи
Татьяна Кошечка Профи (752) 18 лет назад
У меня програмка стоит - PDF Transformer - переганяет в Ворд и в Эксель... очень удобно, особенно когда бланки какие-то на сайтах подаются или предложения разные по ценам..
Mad cat Мудрец (12864) 18 лет назад
есть много софта умеющего это делать, но он не бесплатный
например solidconverterpdf
есть еще какая-то программка от Adobe
Константин Кивилёв Мудрец (10483) 18 лет назад
Если ещё не разобрался, то на панеле инструментов в окне pdf рядом с назатой кнопкой в виде ладони, благодаря которой можно перемещать текст на поле текста, есть две кнопки с закглавной буквой "Т": с рамкой вокруг неё и с рамкой в нижнем правом углу от этой буквы, - нажав на одну из них вместо ладони на поле текса будет высвечиваться тавровый знак как в Word, и так же как в Word можно выделить текст, скопировать его (Ctrl+Insert) и вставить в нужный документ (Ыршае+Insert), или простым перетаскиванием с зажатой клавишей мыши.
Віктор Мастер (1875) 18 лет назад
Если пдф с защитой то сложно, я недавно скачал прогу , кажись Клептомания, она отекстовывает экранные шрифты, может поможет и тебе:
212.109.44.37/file/638294/2195/Kleptomania 2.5 2005-03-17 ru.exe
RPV Профи (920) 18 лет назад
В общем, жутко неудобно :) Как уже и обрисовали - только посредством картинок и распознавания. Конечно, если там стоит защита от копирования. Если защиты нет, то во вьюерах pdf'ных есть функции выделения и копирования фрагментов документа.
Похожие вопросы