Diferencia entre revisiones de «PDF»
(Página creada con «==== Recetario ==== ===== Convertir un PDF a un PDF/A ===== Si se dispone de un documento PDF que '''no''' incluye una capa de texto para poder realizar búsquedas y selección de texto se puede emplear el programa ''OCRmyPDF'' con el siguiente ejemplo: <syntaxhighlight lang="bash"> # Dado el archivo documento.pdf lo convertimos al formato PDF/A con una # resolución de imagen de 250 DPI $ ocrmypdf -l spa --image-display 250 documento.pdf documento-con-texto.pdf </s…») |
m (→Referencias) |
||
Línea 8: | Línea 8: | ||
</syntaxhighlight>Dado que utiliza ''tesseract'' es necesario que esté instalado con el diccionario del lenguaje que necesitamos. |
</syntaxhighlight>Dado que utiliza ''tesseract'' es necesario que esté instalado con el diccionario del lenguaje que necesitamos. |
||
==== Referencias ==== |
|||
* [https://github.com/jbarlow83/OCRmyPDF OCRmyPDF] |
* [https://github.com/jbarlow83/OCRmyPDF OCRmyPDF] |
||
* [https://github.com/tesseract-ocr/ Tesseract] |
* [https://github.com/tesseract-ocr/ Tesseract] |
Revisión del 18:42 15 ene 2024
Recetario
Convertir un PDF a un PDF/A
Si se dispone de un documento PDF que no incluye una capa de texto para poder realizar búsquedas y selección de texto se puede emplear el programa OCRmyPDF con el siguiente ejemplo:
# Dado el archivo documento.pdf lo convertimos al formato PDF/A con una
# resolución de imagen de 250 DPI
$ ocrmypdf -l spa --image-display 250 documento.pdf documento-con-texto.pdf
Dado que utiliza tesseract es necesario que esté instalado con el diccionario del lenguaje que necesitamos.