A

alexsis71

@alexsis71

с нами 19 лет 10 месяцев 2 недели 3 дня
Онлайн 9 лет назад
Подписан на сообщества
2

Очень долго я искал программу для перевода PDF файла в формат HTML. Перепробовал кучу программ. Ставил себе недавно Adobe Acrobat Professional 7.0 и 8.0 Сами редакторы от Adobe не умеют правильно конвертировать PDF файлы в Word, HTML, XML, хотя это у них стандартная функция. Если текст находиться поверх картинки, то хотя из Adobe Acrobat Reader и Adobe Acrobat можно скопировать текст в буфер обмена, при экспорте из Adobe Acrobat текст рендериться на картинку и становиться слитным с ней. Таблицы разъезжаются, некоторые таблицы вообще теряют структуру и текст идет без форматирования. ABBYY transformer части картинки под текстом удаляет при распознавании, таблицы распознаются кусками, а кусками как простые абзацы. Есть еще много продуктов, и каждый что-то делает не так. Большая часть не замечет кирилицу, т.е. наш с вами родной язык. Перепробовав десяток конвертеров и оригиналы от Adobe(censored) я наткнулся на VeryPDF и там тоже есть. Она абсолютно правильно во всем 80-страничном файле отделила текст от картинок.

Это оригинал в Adobe Reader

Здесь когда-то было изображение.
Сделано с NoNaMe
© 2000-2026