Diferencia entre revisiones de «PDF»
mSin resumen de edición |
m (→Referencias) |
||
Línea 8: | Línea 8: | ||
</syntaxhighlight>Dado que utiliza ''tesseract'' es necesario que esté instalado con el diccionario del lenguaje que necesitamos. |
</syntaxhighlight>Dado que utiliza ''tesseract'' es necesario que esté instalado con el diccionario del lenguaje que necesitamos. |
||
==== Referencias ==== |
====== Referencias ====== |
||
* [https://github.com/jbarlow83/OCRmyPDF OCRmyPDF] |
* [https://github.com/jbarlow83/OCRmyPDF OCRmyPDF] |
||
* [https://github.com/tesseract-ocr/ Tesseract] |
* [https://github.com/tesseract-ocr/ Tesseract] |
Revisión del 08:23 16 feb 2024
Recetario
Convertir un PDF a un PDF/A
Si se dispone de un documento PDF que no incluye una capa de texto para poder realizar búsquedas y selección de texto se puede emplear el programa OCRmyPDF con el siguiente ejemplo:
# Dado el archivo documento.pdf lo convertimos al formato PDF/A con una
# resolución de imagen de 250 DPI
$ ocrmypdf -l spa --image-display 250 documento.pdf documento-con-texto.pdf
Dado que utiliza tesseract es necesario que esté instalado con el diccionario del lenguaje que necesitamos.
Referencias
Tríptico impreso
La manera en que se consigue un PDF tipo tríptico es que la página interior se rote 180º para que quede correctamente confrontada con la exterior.
La siguiente es la página que irá como página exterior y portada del tríptico:
Y esta otra es la página que ira como página interior del mismo: