Необходимо написать конвертер их pdf в docx, чтобы:
-весь текст был как текст, т.е. из картинок или из текста в pfd перевести в редактируемых текст в docx, как будто он набран с клавиатуры
-нужно конвертировать формулы в текстовый формат с структурой в математическом формате и выражений. В исходном PDF формулы могут быть в любом из вариантов: в виде изображений, текстовых объектов или встроенных формул
-нужно из картинок (из изображений) или из текста в pdf конвертировать в таблицы word (в docx) и текст, как будто он набран с клавиатуры
Не должно быть каких то изменений после переноса и конвертации в нужный формат как формул, так текстов и другого.
-конвертировать изображения из изображений растровых в вектор при переносе в в docx
При том исходный файл PDF может быть в том числе защищен и нужно обойти защиту.
Необходимо, чтобы конвертер (скрипт) работал под win 10, 11