Metadatos y OpenOffice


rompecabezas.png

A raíz de que se armó un gran revuelo con respecto al manejo de los metadatos en OpenOffice le dedico una entrada separándola de la entrada anterior para que quede mas prolijo.

Esto surge a partir de la infeliz afirmación del Director de Tecnología de Microsoft Ibérica, Héctor Montenegro:
“¿Y la limpieza de metadatos en OpenOffice?  Pues encontraremos que no borra datos ni impresoras de red, rutas de plantillas.”

Antes de pasar a desmentir parte de lo que dice, vamos a empezar explicando que son los metadatos.

¿Qué son los metadatos?
Metadatos es un término que se refiere a toda aquella información que habla sobre los propios datos, es decir, información que define la propia información. Aunque puede sonar enrevesado podemos encontrar ejemplos muy sencillos en la vida cotidiana.
Pongamos como ejemplo la ficha técnica de una enciclopedia, en esta ficha aparecerán datos tales como: autores, número de entradas, número de páginas, fecha de edición, etc. Toda esta información describe cómo es otro conjunto de información como puede ser la enciclopedia.Todos esta información sobre los datos es lo que denominaremos metadatos.

¿Para qué sirven los metadatos?
Los metadatos se utilizan en diferentes ámbitos: bases de datos relacionales, aplicaciones data
warehouse, sistemas de archivos, etc. La posibilidad de definir cómo es el la información contenida
en un lugar, hace de los metadatos una herramienta de amplio espectro.

¿Cual es el problema?

El problema se presenta cuando la creación y manejo de los metadatos es obscuro para el usuario como los famosos documentos de Office doc, xls y ppt. Puede que estemos distribuyendo con nuestros documentos información confidencial que no queríamos que sea pública.
Si nos importa la privacidad y la seguridad deberíamos elegir un formato transparente y controlable.
Esto es, precisamente pese a que les duela a Microsoft, lo que viene a cumplir el estándar OpenDocument, que es el formato por defecto de la suite ofimática libre y gratuita OpenOffice.

Un archivo OpenDocument es un archivo comprimido ZIP  que contiene varios archivos y directorios:

Los archivos XML que lo componen mas interesantes son:
content.xml : El contenido del documento
meta.xml : Contiene metadatos varios como ser: nombre y apellido del autor, fecha de creación, etc.
settings.xml : Contiene información de configuración y los ajustes del documento.
styles.xml : Contiene información de estilos de párrafo, página, carácter, marco, lista.

El formato OpenDocument ofrece una clara separación entre el contenido, la disposición de éste en el documento y los metadatos y los archivos xml son fácilmente editable hasta con un simple editor de texto.

Después de esta introducción vamos a ver hasta que punto tienen razón estos personajes:
“OpenOffice no borra datos”
Sorpresa! OpenOffice, sí borra datos como:
-Datos Personales: Compañia, nombre y apellido, direccion, pais, titulo/posición, Telefonos, Fax, mail.
-Registro de revisiones
-Registro de rutas (con excepción, de la ruta a una plantilla o un objeto incrustado)
-Registro de usuarios, por ejemplo si hubo varios usuarios trabajando en el mismo documento.
-Cantidad de veces que se editó el documento
-Tiempo de edición
Lo único que tienen que hacer es activar la seguridad yendo por: Herramientas, opciones, seguridad, opciones de seguridad y alertas, tilde en borrar información personal al guardar.

“OpenOffice no borra rutas de plantillas”
Esta afirmación es cierta pero desde hace varias versiones que OpenOffice guarda por defecto solamente rutas relativas:
Si generan un documento con plantillas, al descompactarlo y editar el archivo meta.xml obtendrán algo así:
<meta:template xlink:type=”simple” xlink:actuate=”onRequest” xlink:title=”myLetterTemplate” xlink:href=”../../.openoffice.org/3/user/template/myLetterTemplate.ott” meta:date=”2009-04-02T20:30:27″/>
Lo cual no revela absolutamente nada sensible, no obtenemos la ruta completa.
La única manera que muestre la ruta real es modificando en herramientas, opciones, cargar/guardar, general y destildando las opciones de ruta relativa.
Si las destildamos y volvemos a grabar nos vamos a encontrar con la ruta real:
/home/usuario/.openoffice.org/3/user/template/myLetterTemplate.ott

“OpenOffice no borra rutas de elementos incrustados”
Es el mismo caso anterior, las rutas que se guardan son relativas y no completas.


“OpenOffice guarda registro de impresoras”

Esto es una realidad, pero OpenDocument es fácilmente auditable, basta con descompactar el documento, editar el archivo setting.xml y buscar la entrada:
<config:config-item config:name=”PrinterName” config:type=”string”>
Borrar el contenido de la misma y salvarla.

Las extensiones al rescate:

OpenOffice es como el Firefox de las aplicaciones Ofimáticas. Si hay algo que le da mucho valor al producto son las extensiones que nos permiten ampliar aun mas las básicas capacidades del mismo.
Supongamos que tenemos que realizar una exposición y para ello armamos unas hermosas diapositivas en impress con efectos que quedaron muy lindos para distribuir e impresionar a la audiencia.
Sin pensarlo, al igual que con Writer seguramente estaremos dejando todo tipo de datos: rutas de objetos incrustados, correcciones, diapositivas ocultas, etc.
Para ello les recomiendo instalarse Presentation Minimizer que cumple dos funciones, limpiar datos y reducir el tamaño de la presentación
Seguramente a alguien se le ocurrió armar una extensión parecida para los documentos de Writer o Calc , tal vez exista y no me tome el suficiente tiempo para buscarla.

ACTUALIZACION 15-06-2009

Acabo de encontrar una extensión que limpia metadatos para writer, pueden descargarlo del siguiente link:

http://extensions.services.openoffice.org/project/Anonymous


Utilicemos la opción final: borremos directamente los archivos xml

Algo que descubrí, es que se pueden eliminar los archivos meta.xml y settings.xml del contenedor zip ya que no afectara el contenido del documento.
La próxima vez que abran ese documento con OpenOffice regenerará ambos si lo salvan nuevamente.
Notaran que ambos archivos quedaran regenerados pero sin datos relevantes, siempre y cuando tengan activada la opción de seguridad propia del OpenOffice.
De esta forma tendremos documentos 100% seguros sin información personal, ni rutas ni siquiera impresoras.

Tenemos muchos archivos y queremos borrar todo rastro nuestro.
¿Por que no usamos un poquito de Bash scripting?
Armen un script que recorra el directorio y haga un zip -d meta.xml settings.xml de todos los documentos.
Simple, rápido y sin ninguna aplicación de terceros.

Nos pueden asustar diciendo que OpenOffice es inseguro, es parte de la táctica de FUD de Microsoft.
Vimos como con un par de simples consejos podemos tener nuestra información segura. Y esto no es ninguna Magia, es la realidad.

ESTE TEXTO SE PUBLICA BAJO LICENCIA CREATIVE COMMONS BY-NC-SA 2.5 AR.

Por lo tanto, usted es libre de: 1) Copiarlo, distribuirlo y exhibirlo. 2) Hacer obras derivadas. Bajo las siguientes condiciones: 1) Debe dar atribución mencionando el nombre del autor y del LUG Zona Norte. En caso de las notas que no llevan firma, mencionar sólo el nombre del LUG.

2) Usted no puede usar esta obra con fines comerciales. 3) Si usted altera, transforma, o crea sobre este texto, sólo podrá distribuir la obra derivada resultante bajo una licencia idéntica a ésta.

Más detalles y texto legal de la licencia en: http://creativecommons.org/licenses/by-nc-sa/2.5/ar

  1. No comments yet.
(will not be published)
IMPORTANT! To be able to proceed, you need to solve the following simple math (so we know that you are a human) :-)

What is 7 + 14 ?
Please leave these two fields as-is: