MAT: Limpiando metadatos en Ubuntu

Capítulo 3 del tema de metadatos y software libre. Ya los limpiamos de LibreOffice y de los JPG, pero ahora toca el capítulo final. ¿Si te digo que hay un toolkit que los limpia de casi todos los formatos? Ok, podría haber empezado por ahí… pero así me ha dado para tres artículos.

¿Qué es MAT? Es Metadata Anonymisation Toolkit, una serie de herramientas que borrarán los metadatos de vuestros archivos en Ubuntu: ofimáticos, imágentes, pdf, torrents… No soporta todos los formatos del mundo, pero sí muchos de los más habituales.

Aunque si vamos a ser sinceros, este no es un software de Ubuntu sino de Debian, pero al ser una aplicación el Python bastan con unas cuántas dependencias instaladas y la cosa irá como la seda. Para esto tienes dos opciones: la corta y la larga.

La corta es mirar este enlace y ver cómo instalar el PPA que se han currado los de Perseoblog.

La larga es la que os voy a contar aquí. Lo primero, a instalar las dependencias:

sudo apt-get install python-hachoir-core python-hachoir-parser python-pdfrw python-cairo python-poppler python-mutagen libimage-exiftool-perl libimage-info-perl

Con esto instalado basta bajarse el archivo comprimido con el programa desde su sitio oficial. Una vez descargado lo descomprimís y le otorgáis permisos de ejecución. Podéis hacerlo desde el entorno gráfico con un click derecho en Propiedades->Permisos->Permitir ejecutar el archivo como un programa sobre el archivo mat-gui; pero si preferís también podéis hacerlo desde comandos:

sudo chmod  +x mat-gui

Llegados a este punto deberíais tener el programa instalado y funcionando. Para su uso tendrás un entorno gráfico extremadamente simple: Un botón para agregar archivos, otro para limpiarlos, un botón para buscar qué ficheros tienen metadatos y un botón de cierre/apagado de la aplicación. Todos con iconos muy intuitivos. En su menú de Preferencias (se accede a través del menú Edit) podrás definir opciones como si quieres que genere una copia limpia de metadatos o si prefieres que directamente sobreescriba el original (la opción Backup), y algunas más menos interesante.

En fin, con esto ya podéis vivir más tranquilos en cuanto al tema de ir dejando vuestra información por la red.

Eliminar metadatos de fotos en Ubuntu

Si hablábamos el otro día de metadatos en OpenOffice/LibreOffice hoy vamos a ver cómo borrar los metadatos de las fotos, en este caso sólo del formato jpg. Muchas veces subimos fotografías desde el móvil, lo cual lleva un montón de metadatos inscrustados, los llamados EXIF.

Y es que si una cámara ya va proporcionar la fecha y la hora en la que fue tomado y el modelo (y en caso, por ejemplo, de mi cárama Olympus un montón de datos técnicos, como el modo de flash, el perfil de color…) un móvil puede traer hasta las coordenadas geográficas del lugar donde se ha tomado la foto.

Ya sea por respeto a nuestra intimidad, paranoia o simplemente que hayamos puesto una excusa y esa foto nos la pueda joder (“-Cariño estaba trabajando” “-Pues según esta foto a esa hora estabas en el bar”) en Ubuntu/Mint/Debian tenemos una herramienta que permite que nuestros jpg se queden limpitos de ellos: jhead.

Se trata de una herramienta de línea de comandos, por lo que lo primero es instalarlo:

sudo apt-get install jhead

Luego la orden para eliminar los datos tampoco tiene mucha ciencia:

jhead -purejpg /ruta/imagen.jpg

Basta con pasarle la ruta de la imagen que queremos dejar sin metadatos y punto. Pero lo verdaderamente útil, como en todo el software de consola, viene cuando queremos trabajar con muchos archivos:

jhead -purejpg /ruta/*.jpg

Podemos usar comodines para afectar a todos los archivos de una carpeta concreta, ahorrándonos el trabajo de ir uno a uno.

Como ya dije arriba, este software sólo trabaja con jpg y sus derivaciones: jpeg, JPEG y JPG. En cualquier caso es el formato más habitual en cámaras y móviles, pero de todas formas en el futuro hablaremos de más opciones para trabajar con imágenes.

Borrar metadatos personales de OpenOffice y LibreOffice

Son famosas las cagadas con los metadatos de políticos, valga este mismo como ejemplo y Chema Alonso tiene muchos más en su blog, cuando intentan falsear o filtrar una información “comprometedora”. Para ciertas cosas es útil estar gobernado por inútiles, no lo niego (es que si además de desalmados llegan a ser listos íbamos a estar bien jodidos).

Existen muchas herramientas para borrar los metadatos de OpenOffice y Libre Office, pero si no buscamos una seguridad paranoica, sino simplemente evitar que vayan datos junto al archivo como nombre, dirección… hay formas sencillas de hacerlo.

Si estás elaborando un documento nuevo, lo mejor es guardarlo ya sin los metadatos. Es fácil configurar el OpenOffice para que lo haga:

  • Te vas al menú Herramientas y allí seleccionas Opciones.
  • En opciones, en el árbol de la izquierda eliges Seguridad. En la derecha verás un apartado Opciones de Seguridad y alertas. Allí pulsas el botón Opciones.
  • Dentro del menú que se te abrirá marcas Elimina la información personal al guardar.

libre office

Con esto ya logras que el archivo se guarde sin tus datos personales. ¿Y con los archivos ya guardados?. Bueno, los archivos nativos de OpenOffice y LibreOffice realmente son un archivo comprimido (en tar.gz creo) que podéis abrir con cualquier compresor/empaquetador (7zip, FileRoller, WinZip…) y donde podéis ver varios xml que forman el documento. Los metadatos están guardados en meta.xml así que, si borráis ese archivo (o lo modificáis para eliminar lo que no queréis que salga) está arreglado, muerto el perro se acabó la rabia. También tenéis otros xml por ahí como el settings, donde se guardan datos sobre impresoras, servidores… que pueden ser sensibles. Incluso se podría hacer un script que borre estos metadatos, si buscáis un poco seguro que hay más de uno colgado (y si no, pedidlo y me curro uno en algún artículo).

En fin, otra ayudita para vuestro anonimato y que no os pase como a muchos politicastros. Si queréis algo más profundo y currado, a Chema Alonso me remito again.