Diferencia entre revisiones de «PDF»

De Taquiones
(Página creada con «==== Recetario ==== ===== Convertir un PDF a un PDF/A ===== Si se dispone de un documento PDF que '''no''' incluye una capa de texto para poder realizar búsquedas y selección de texto se puede emplear el programa ''OCRmyPDF'' con el siguiente ejemplo: <syntaxhighlight lang="bash"> # Dado el archivo documento.pdf lo convertimos al formato PDF/A con una # resolución de imagen de 250 DPI $ ocrmypdf -l spa --image-display 250 documento.pdf documento-con-texto.pdf </s…»)
 
Línea 8: Línea 8:
</syntaxhighlight>Dado que utiliza ''tesseract'' es necesario que esté instalado con el diccionario del lenguaje que necesitamos.
</syntaxhighlight>Dado que utiliza ''tesseract'' es necesario que esté instalado con el diccionario del lenguaje que necesitamos.


===== Referencias =====
==== Referencias ====

* [https://github.com/jbarlow83/OCRmyPDF OCRmyPDF]
* [https://github.com/jbarlow83/OCRmyPDF OCRmyPDF]
* [https://github.com/tesseract-ocr/ Tesseract]
* [https://github.com/tesseract-ocr/ Tesseract]

Revisión del 18:42 15 ene 2024

Recetario

Convertir un PDF a un PDF/A

Si se dispone de un documento PDF que no incluye una capa de texto para poder realizar búsquedas y selección de texto se puede emplear el programa OCRmyPDF con el siguiente ejemplo:

# Dado el archivo documento.pdf lo convertimos al formato PDF/A con una 
# resolución de imagen de 250 DPI
$ ocrmypdf -l spa --image-display 250 documento.pdf documento-con-texto.pdf

Dado que utiliza tesseract es necesario que esté instalado con el diccionario del lenguaje que necesitamos.

Referencias