Перекодировать PDF документ из CP1252 в CP1251

Question

Перекодировать PDF документ из CP1252 в CP1251

Владислав Волков Мастер (2113), закрыт 13 лет назад

Дополнен 14 лет назад

Существует PDF документ. Книга с множеством картинок. Вид отличный. Но при попытке скопировать текст выходят кракозябры. На сайте где вылечивают кракозябры робот объяснил причину как CP1252 -> CP1251.
Помогите люди добрые.. . объясните что делать.

PDF документ был создан из файла КваркЭкспресса, книга в основном набрана шрифтом Peterburg. именно он и глючит. В макете эфект тот же что и в PDF, выглядит нормально а при копировании - кракозябры, при замене шрифта тоже кракозябры.

Дополнен 14 лет назад

Да уш слобавт ресусрик ответов то, не прошло и года как сам нашел выход.
Добрые люди на руборде подсказали
Прога - pdf-recode.exe

Работает элементарно. В обозревателе переносите на нее файл PDF, после обработки появляется его копия с измененной кодировкой.

Ссылка на ветку обсуждения программы Adobe Acrobat
http://forum.ru-board.com/topic.cgi?forum=5&bm=1&topic=24211&start=1160#lt

Answer 1

Сергей Степанов! Мудрец (14280) 14 лет назад

Думаю вся проблема именно в шрифтах!
Peterburg явно латиница, А нужно было, еще при верстке, использовать PeterburgСYR и не было бы проблем!
И я не пойму что за бред: "Файнридере или PDF Трансформере создать ратсровый PDF c OCR cлоем",
какой растровые и OCR слои? В формате *.PDF ОДИН слой!
И тот же PDFTransformer, которому глубоко начхать на кодировку, все читабельно трансформирует в документ Word, с сохранением форматирования !
А копировать, особенно из Finereader, вообще глупая затея.
в первую очередь, Finereader должен быть лицензионный и с серийником, иначе срабатывает защита от копирования распознанного текста. Да и вообще, уже крайняя глупость, копировать текст в буфер обмена из *.PDF документа!! !
Зачем, когда есть множество других, более корректно работающих, ПРОГРАММНЫХ СРЕДСТВ !
А для того, чтобы убедиться в пригодности твоего *.PDF к печати в типографии, открой его в Adobe Illustrator, если там не читается, то твой *.PDF править (внедрять шрифты) при помощи PitStop или в топку, или переверстать, применив шрифт PeterburgСYR!

Владислав ВолковМастер (2113) 14 лет назад

Возможно вы правы на счет Peterburg, но если это латиница, почему в нем в этом шрифте есть русские буквы, простите за ламерство, если я то-то не понимаю. Вы говорите что в PDF один слой. А разве Acrobat не позволяет провести Оптическое распознавание текста, после чего PDF из сканирвоанных страниц и приобретает OCR слой.

На счет лицензии и серийника это я комментировать не буду. Только :)
Все что делает FR и Transformer с PDF это распознает его с возможность сохранения в разные форматы в том числе и в растровый PDF c OCR слоем. Может я путаю термины, я имею ввиду PDF из картинок и с оптически распознанным текстом, со всеми вытекающими глюками и ошибками. Как я писал замена в макете шрифта приводит к кракозябрам.

Ваш выпад
"крайняя глупость, копировать текст в буфер обмена из *.PDF документа!!! "
Мне кажется странным, и глупым. Вы что в PDF книге никогда текст не искали?
Нормальный макет надо переводить в PDF документ. Как это делает весь цивилизованный мир

Владислав ВолковМастер (2113) 14 лет назад

Да еще добавлю вы тут советовали в топку и переверстывать, а проблема решилась программкой весом в 3 мегабайта. И не надо оказалось никаких крайностей
Будьте проще... помогает

Сергей Степанов! Мудрец (14280) Да Ламерства и просто поверхностных знаний у тебя хватает! А надо было, всего навсего, сделать Префлайт (Preflight) документа и все встало бы на места, точнее, выявились бы все проблемы и проблемы с шрифтами в том числе! А если делать в формате *.PDF/X-1 a,то тогда все твои проблемы будет решать типография! ,это называется «Слепой» обмен данными при подготовке к печати! [ссылка заблокирована по решению администрации проекта] Помимо всего к Акробату идет мощнейший плагин - PitStop! Вот краткое описание: Описание: PitStop Professional – это лучший инструмент допечатной проверки, автокоррекции и редактирования документов PDF. Он выполнен в виде подключаемого модуля Adobe Acrobat и содержит два десятка встроенных профилей Enfocus PDF Profiles, предназначенных для проверки ключевых атрибутов PDF-файлов и автоматической коррекции типовых ошибок. Enfocus PitStop Professional предоставляет исчерпывающий набор интерактивных инструментов и для глобальной замены шрифтов тоже! Удачи!

Сергей Степанов!Мудрец (14280) 14 лет назад

Да, для писюка PC, у меня MAC, правильная ссылка на PitStop Professional: здесь

Answer 2

В Adobe Acrobat 9 Pro разве что попробовать. Но не факт - вообще не факт, что в PDF текст хранится в кодировке cp1252 или cp1251. Более вероятным кажется, что там все в unicode.

А проблема, как я понимаю, при попытке скопировать оттуда текст через буфер обмена?

Answer 3

В PDF часто шрифты встраиваются не целиком, а только используемые символы (в целях уменьшения размера файла) . Ну и кодировочка съезжает соответственно. Как это вылечить -- не знаю.

Answer 4

Иван Русский Знаток (415) 5 лет назад

Спасибо за pdf-recode.exe !

Anatol AnatolioПрофи (652) 5 лет назад

Иван где нашли прогу? не могу найти скачивание

Иван Русский Знаток (415) В интернете. Искал по названию с расширением. В яндексе - первая же ссылка.