Diferencia entre revisiones de «PDF»

De Taquiones
mSin resumen de edición
Línea 11: Línea 11:
* [https://github.com/jbarlow83/OCRmyPDF OCRmyPDF]
* [https://github.com/jbarlow83/OCRmyPDF OCRmyPDF]
* [https://github.com/tesseract-ocr/ Tesseract]
* [https://github.com/tesseract-ocr/ Tesseract]
[[Categoría:Referencias]]

Revisión del 18:43 15 ene 2024

Recetario

Convertir un PDF a un PDF/A

Si se dispone de un documento PDF que no incluye una capa de texto para poder realizar búsquedas y selección de texto se puede emplear el programa OCRmyPDF con el siguiente ejemplo:

# Dado el archivo documento.pdf lo convertimos al formato PDF/A con una 
# resolución de imagen de 250 DPI
$ ocrmypdf -l spa --image-display 250 documento.pdf documento-con-texto.pdf

Dado que utiliza tesseract es necesario que esté instalado con el diccionario del lenguaje que necesitamos.

Referencias