Diferencia entre revisiones de «PDF»
m (→Referencias) |
mSin resumen de edición |
||
Línea 11: | Línea 11: | ||
* [https://github.com/jbarlow83/OCRmyPDF OCRmyPDF] |
* [https://github.com/jbarlow83/OCRmyPDF OCRmyPDF] |
||
* [https://github.com/tesseract-ocr/ Tesseract] |
* [https://github.com/tesseract-ocr/ Tesseract] |
||
[[Categoría:Referencias]] |
Revisión del 18:43 15 ene 2024
Recetario
Convertir un PDF a un PDF/A
Si se dispone de un documento PDF que no incluye una capa de texto para poder realizar búsquedas y selección de texto se puede emplear el programa OCRmyPDF con el siguiente ejemplo:
# Dado el archivo documento.pdf lo convertimos al formato PDF/A con una
# resolución de imagen de 250 DPI
$ ocrmypdf -l spa --image-display 250 documento.pdf documento-con-texto.pdf
Dado que utiliza tesseract es necesario que esté instalado con el diccionario del lenguaje que necesitamos.