Página 1 de 1

exportar un pdf a html con libreoffice macro

Publicado: Vie Dic 11, 2020 5:35 am
por arivas_2005
Mi saludo
Tengo un dilema/reto..
cuento con una serie de reportes pdf con formato igual y debo pasarlos a texto
Hice la siguiente prueba
Abrí el PDF con libreoffice 5.4
luego apliqué los pasos siguientes:

Archivo
Exportar
Filtro Document HTML (Draw) (:html;htm)
save
Asignar Diseño nuevo (Asignar diseño) (Siguiente)
Documento HTML unico (Tipo de publicacion) (siguiente)
Resoluion del monitor ->Alta
Crear
Nombre del diseño existente N123
sobreescribir Si
Aceptar

y vaya que si me los pasa a texto..(claro en formato html pero en fin es texto..)

Cómo se podría obtener el mismo resultado usando una macro?
O usando una linea de comando?

Hace algun tiempo recuerdo haber resuelto una dificultad con unos formularios en word y pasarlos a txt y lo hice con la linea
/opt/libreoffice5.1/program/soffice --headless --convert-to txt:Text "$ARCHIVO" &
en un scriptillo linuz. pero con lo de PDF a html no encuentro ideas en las búsquedas

Gracias