Сергей Степанов!
Мудрец
(14280)
14 лет назад
Думаю вся проблема именно в шрифтах!
Peterburg явно латиница, А нужно было, еще при верстке, использовать PeterburgСYR и не было бы проблем!
И я не пойму что за бред: "Файнридере или PDF Трансформере создать ратсровый PDF c OCR cлоем",
какой растровые и OCR слои? В формате *.PDF ОДИН слой!
И тот же PDFTransformer, которому глубоко начхать на кодировку, все читабельно трансформирует в документ Word, с сохранением форматирования !
А копировать, особенно из Finereader, вообще глупая затея.
в первую очередь, Finereader должен быть лицензионный и с серийником, иначе срабатывает защита от копирования распознанного текста. Да и вообще, уже крайняя глупость, копировать текст в буфер обмена из *.PDF документа!! !
Зачем, когда есть множество других, более корректно работающих, ПРОГРАММНЫХ СРЕДСТВ !
А для того, чтобы убедиться в пригодности твоего *.PDF к печати в типографии, открой его в Adobe Illustrator, если там не читается, то твой *.PDF править (внедрять шрифты) при помощи PitStop или в топку, или переверстать, применив шрифт PeterburgСYR!
Владислав ВолковМастер (2113)
14 лет назад
Возможно вы правы на счет Peterburg, но если это латиница, почему в нем в этом шрифте есть русские буквы, простите за ламерство, если я то-то не понимаю. Вы говорите что в PDF один слой. А разве Acrobat не позволяет провести Оптическое распознавание текста, после чего PDF из сканирвоанных страниц и приобретает OCR слой.
На счет лицензии и серийника это я комментировать не буду. Только :)
Все что делает FR и Transformer с PDF это распознает его с возможность сохранения в разные форматы в том числе и в растровый PDF c OCR слоем. Может я путаю термины, я имею ввиду PDF из картинок и с оптически распознанным текстом, со всеми вытекающими глюками и ошибками. Как я писал замена в макете шрифта приводит к кракозябрам.
Ваш выпад
"крайняя глупость, копировать текст в буфер обмена из *.PDF документа!!! "
Мне кажется странным, и глупым. Вы что в PDF книге никогда текст не искали?
Нормальный макет надо переводить в PDF документ. Как это делает весь цивилизованный мир
Владислав ВолковМастер (2113)
14 лет назад
Да еще добавлю вы тут советовали в топку и переверстывать, а проблема решилась программкой весом в 3 мегабайта. И не надо оказалось никаких крайностей
Будьте проще... помогает
Александр Борщак
Гуру
(3309)
14 лет назад
В Adobe Acrobat 9 Pro разве что попробовать. Но не факт - вообще не факт, что в PDF текст хранится в кодировке cp1252 или cp1251. Более вероятным кажется, что там все в unicode.
А проблема, как я понимаю, при попытке скопировать оттуда текст через буфер обмена?
Владислав ВолковМастер (2113)
14 лет назад
Да именно в этом. Но текст же существует его же можно скопировать и вставить. Только кодирвока как я понимаю не та.В Акробате хоть убей не моуг найти ничего подходящего. Единственный полувариант пока, это в Файнридере или PDF Трансформере создать ратсровый PDF c OCR cлоем. Перекодировать они не могут. Но это ущербный враиант. Нормальный векторный PDF переделывать в растровый PDF - мазахизм полный.
The Cat
Искусственный Интеллект
(116172)
14 лет назад
В PDF часто шрифты встраиваются не целиком, а только используемые символы (в целях уменьшения размера файла) . Ну и кодировочка съезжает соответственно. Как это вылечить -- не знаю.
Владислав ВолковМастер (2113)
14 лет назад
Добавил в вопрос ответ !!!Нашел прогу на Руборде, вроде бы все сделала как надо. Есть конечно недостатки, но текст реанимировался слава богу.