Diferencia entre revisiones de «PDF»

De Taquiones
mSin resumen de edición
Línea 8: Línea 8:
</syntaxhighlight>Dado que utiliza ''tesseract'' es necesario que esté instalado con el diccionario del lenguaje que necesitamos.
</syntaxhighlight>Dado que utiliza ''tesseract'' es necesario que esté instalado con el diccionario del lenguaje que necesitamos.


==== Referencias ====
====== Referencias ======
* [https://github.com/jbarlow83/OCRmyPDF OCRmyPDF]
* [https://github.com/jbarlow83/OCRmyPDF OCRmyPDF]
* [https://github.com/tesseract-ocr/ Tesseract]
* [https://github.com/tesseract-ocr/ Tesseract]

Revisión del 08:23 16 feb 2024

Recetario

Convertir un PDF a un PDF/A

Si se dispone de un documento PDF que no incluye una capa de texto para poder realizar búsquedas y selección de texto se puede emplear el programa OCRmyPDF con el siguiente ejemplo:

# Dado el archivo documento.pdf lo convertimos al formato PDF/A con una 
# resolución de imagen de 250 DPI
$ ocrmypdf -l spa --image-display 250 documento.pdf documento-con-texto.pdf

Dado que utiliza tesseract es necesario que esté instalado con el diccionario del lenguaje que necesitamos.

Referencias
Tríptico impreso

La manera en que se consigue un PDF tipo tríptico es que la página interior se rote 180º para que quede correctamente confrontada con la exterior.

La siguiente es la página que irá como página exterior y portada del tríptico:

Programa de mano - página exterior.png


Y esta otra es la página que ira como página interior del mismo:

Programa de mano - páginas interiores.png