PDF

De Taquiones

Recetario

Obtener una imagen de un PDF

Para obtener una imagen de una página de un archivo PDF se puede utilizar el programa convert del paquete Imagemagick de la siguiente forma:

# para obtener la primera página en png 
$ convert archivo.pdf archivo.png 
# o en jpeg
$ convert archivo.pdf archivo.png
Convertir un PDF a un PDF/A

Si se dispone de un documento PDF que no incluye una capa de texto para poder realizar búsquedas y selección de texto se puede emplear el programa OCRmyPDF con el siguiente ejemplo:

# Dado el archivo documento.pdf lo convertimos al formato PDF/A con una 
# resolución de imagen de 250 DPI
$ ocrmypdf -l spa --image-display 250 documento.pdf documento-con-texto.pdf

Dado que utiliza tesseract es necesario que esté instalado con el diccionario del lenguaje que necesitamos.

Referencias
Tríptico impreso

La manera en que se consigue un PDF tipo tríptico es que la página interior se rote 180º para que quede correctamente confrontada con la exterior.

La siguiente es la página que irá como página exterior y portada del tríptico:

Programa de mano - página exterior.png


Y esta otra es la página que ira como página interior del mismo:

Programa de mano - páginas interiores.png