Разработка технической документации и технические писатели Технические писатели и разработка технической документации технические писатели в Телеграм 

 obmen_soobsheniyami.png Чат для технических писателей 
 Зарегистрируйтесь
Страницы: 1
RSS
pdf word
 
Нужно извлечь из  pdf текст с изображениями, без потери форматирование, кто спасет?
 
Боюсь, что Вас не спасет никто. В текстовых редакторах, куда Вы, по-видимому, собираетесь поместить извлеченный фрагмент, и Акробате разные принципы форматирования текстов.
Когда нет знания, есть мнение
 
Недавно я решал такую задачу.
Автору нужно было создать текстовый документ - инструкцию по мотажу.
Программное обеспечение у автора - Word, CAD  Pro Engineer, PLM Windchill.

Действия автора документа
Листы инструкции, содержащие текст создавались в Worde.
Листы, содержащие рисунки (сложные), автор создал средствами CAD  Pro Engineer. При этом содержание рисунков программно связано с 3-х мерной моделью и находится в ее составе.

Цели
1 Документ согласовать со всеми службами и сдать в электронный архив.
2 Архив должен распечатать документ на бумажный носитель
3 Содержание документа и рисунков, входящих в него, должно быть редактируемо.

Решения
Первое - Рисунки подвергнуть конвертации в PDF формат с последующей конвертацией в формат DOC и вставкой их в нужные места документа. При этом содержание 3х-мерной модели (электронная модель сборки) подвергнуть операции, позволяющей сохранить все ее составляющие в совокупности файлов), заархивировать, и сдать в архив в виде дополнительного файла, который будет использоваться автором только для внесения изменений в рисунки).
Второе - Рисунки из ProE преобразовать в формат DWG (AutoCAD), и оформив в соответствующие шаблоны сдать в архив в виде отдельного файла (-ов) в оставе документа.
Третье - Электронную модель сборки сдать в архив - как документ. Рисунки должны содержаться в модели как "бесплатное" приложение, а  редактирование рисунков, находящихся в составе инструкции,  должно сопровождаться корректировкой данной модели. На этом основании инструкцию сдать в архив в виде формата DOC, не сопровождая ненужным "приложением".
Четвертое решение - Содержание рисунка, находящегося в тектовом документе программно связано с содержанием самой модели.

Оценка решений.
Первое решение - содержание рисунка связано с содержанием модели, что облегчает автору внесение изменений, однако, будучи заархивирована (модель) в отдельном файле (оторванном от модели, а модель тоже самостоятельный документ - электронная модель сборочного чертежа) будет необходимо производить работы по редактированию двух моделей. Что значительно требует дополнительных временных затрат, и повышает риск дополнительных ошибок.
Второе решение - Автору нужно осваивать дополнителный программный продукт, на освоение которого требуется дополнительное время. Требуется дополнительное время на редактирование рисунков в формате DWG в дополнение к редактированию содержания модели.
В согласующих инстанциях и в архиве требуется установка дополнительного Прог. обеспечения (AutoCAD) для визуализации содержимого файлов в формате DWG. Все это выливается в дополнительное время, обслуживание, в конечном счете деньги - цену документа, которую мы невсегда не умеем считать).
Третье решение - решение, не содежащее ничего лишнего и объективно экономичнее первого и второго.
Четвертое решение - самое удачное. Фантастично, но реализуемо при определенных условиях.

Привел этот пример, для того чтобы объективно показать те сложности, которые возможно предстоит решать в подобных ситуациях.
Заранее прошу извенения за возможные неточности в анализе.
Человек стал человеком благодаря воображению, а вовсе не труду
 
Попробуй программу Iceni Gemini очень помогает :)
 
Цитата
Нужно извлечь из  pdf текст с изображениями, без потери форматирование, кто спасет?
Не знаю, о чем собственно идет речь, но  я для вырезания фрагментов PDF-документа (хоть текста, хоть графики)  пользуюсь пиктограммой Snapshot Toоl ( "фотоаппарат"), которая видна при просмотре документа средствами  Adobe Acrobat (не Acrobat Reader).
Страницы: 1
Читают тему