Añadir un PDF a un sitio web usando una etiqueta de HTML5

Existen varias formas de insertar un PDF dentro de un sitio web, una de ellas es usar alguna de estas etiquetas:

  • embed
  • object
  • iframe

Antaño solo teníamos la opción de usar la etiqueta iframe, dado que embed y object se añadieron para la especificación HTML5. En todo caso el procedimiento con las tres es el mismo: ponemos la URL del fichero PDF como valor del atributo src y definimos el tamaño mediante los atributos width y height:

<!--Ejemplos varios-->
<iframe src="http://rutaamipdf/fichero.pdf" width="95%" height="100%"></iframe>

<embed src="http://rutaamipdf/fichero.pdf" width="95%" height="100%"></embed>

<object src="http://rutaamipdf/fichero.pdf" width="95%" height="100%"></object>

¿Problemas? Pues sí, que con este método dependemos de que el navegador que está usando el usuario tenga incorporado algún visualizador de PDF. En algunos casos tiene que ser mediante un plugin externo, como en Chrome, en otros ya viene incluído por defecto en el propio navegador.

Uniendo documentos pdf en Linux con pdftk

En el anterior artículo hablábamos sobre cortar pdf en distros Linux utilizando la utilidad pdftk. Ahora vamos a ver cómo hacer lo contrario: unir varios pdf en uno solo.

No repetiré los pasos de instalación de pdftk porque están en el artículo anterior. Obviando esto nos metemos en harina: lanzamos un terminal y nos ponemos en la carpeta en la que están los pdf y cuando estemos allí usamos el siguiente comando (en el ejemplo fusionaremos dos archivos que se llaman archivo1.pdf y archivo2.pdf en uno nuevo llamado nuevoArchivo.pdf)

pdftk archivo1.pdf archivo2.pdf cat output nuevoArchivo.pdf

Y luego podemos combinar ambas ideas: cortar y unir en un solo comando. En el ejemplo extraeremos las dos primeras páginas del archivo1, la quinta del archivo2 y la octava del archivo1 y crearemos el archivo3 con estas en ese orden.

pdftk A=archivo1.pdf B=archivo2.pdf cat A1-2 B5 A8 output archivo3.pdf

Como veis nos servimos del comando cat para concatenar archivos y de output para dirigir la salida de cat hacia un nuevo archivo pdf.

Cortando y dividiendo documentos pdf en Linux

No es extraño (que cantaba Tom Jones) el tener que cortar un documento pdf. Hoy mismo me mandaron dos facturas en el mismo documento y las necesitaba separadas porque tenía que enviarlas a dos correos distintos. ¿Cómo se puede solucionar esto?

Lo primero es instalar pdftk:

#si lo hacemos en una distro Ubuntu/Debian
sudo apt-get install pdftk

#Si lo hacemos en Fedora/RedHat
sudo yum install pdftk

Una vez instalado la forma más simple de cortar el pdf es usan burst, que lo que hará será generar una página independiente por cada una de las páginas del pdf original.

pdftk archivo.pdf burst

Esto generará varios archivos llamados pg_001.pdf, pg_002.pdf… en mi caso me bastaba con esto porque eran dos páginas pero ¿qué pasa si manejas un pdf de 600? Es probable que no quieras 600 archivos nuevos. Por suerte pdftk es una herramienta potente que nos da gran flexibilidad a la hora de trabajar, y disponemos de un comando que nos permite extraer una serie de páginas concretas de un documento hacia un nuevo archivo. Vamos con el ejemplo, donde sacaremos las páginas de la 30 a la 45 de un archivo y generaremos uno nuevo con ellas:

$ pdftk A=archivo.pdf cat A30-45 output archivofinal.pdf

Y es más, podemos extraer páginas de dos pdf distintos y sacarlas todas en un mismo documento. En el ejemplo sacaremos las páginas del 10 al 15 del documento 1 y las 15-18 del documento 2:

$ pdftk A=archivo.pdf B=archivo.pdf cat A10-15 B15-18 output archivofinal2.pdf

Y próximamente veremos cómo fusionar archivos.