Metadatos para el gobierno de la información

Elisa Garcia-Morales

Los metadatos adquieren nuevo protagonismo

Hace no muchos años cuando preguntaba a mis alumnos qué son los metadatos, la mayoría  ni siquiera conocía la palabra. El cambio llegó el día que alguien respondió: si, ayer oí esa palabra en la televisión; unos policías en la serie DSI investigaban sobre los metadatos de las pruebas informáticas. El  término se ha hecho definitivamente famoso desde el escándalo WikiLeaks y hoy día es de frecuente aparición en la prensa asociado, lamentablemente, a problemas de seguridad de la información o espionaje. Valgan como ejemplo las revelaciones durante 2013 y 2014  sobre la red de vigilancia de datos de la NSA.

Los metadatos “datos sobre los datos” han sido un instrumento de uso habitual por los profesionales de la información en diversos campos de aplicación: bibliotecas, archivos, centros de documentación, gestores de contenidos, gestores documentales,  records managers, etc. Los avances en la estandarización conceptual, técnica y semántica han sido muy grandes, aunque el término metadato sigue siendo un concepto que continua significando distintas cosas para distintas personas.

Y no es de extrañar, navegar por el proceloso universo de los metadatos no es fácil ni para profesionales ni para profanos. Baste con echar una ojeada al excelente mapa (1)  elaborado por la universidad de Indiana para ver la complejidad a la que ha llegado el asunto. Solo en el ámbito cultural se identifican más de 105 estándares diferentes y  las diferencias según el dominio, la función y el propósito pueden llegar a ser grandes e irreconciliables.

Los datos se encuentran con los metadatos

Estamos asistiendo a una importante transformación del discurso sobre los metadatos. El crecimiento exponencial de la información digital, el fenómeno Big DATA, las tendencias hacia el Open data y también el mundo del “small data” empresarial  han puesto en primer plano esta cuestión. Son ahora los responsables de TI y del mundo de las aplicaciones datos los que plantean cuestiones que ya nos suenan conocidas:

¡Hace falta un vocabulario de datos común¡ dice panel de expertos BI Tech Target (2). Los datos constituyen una Torre de Babel dentro de las empresas, los departamentos emplean distintas métricas y en este contexto cualquier esfuerzo de cruzar y explotar información de manera transversal consume enormes recursos que afectan a la eficiencia operacional. Parece comenzar un camino de vuelta hacia los diccionarios de datos de los que se hablaba en estados iniciales de definición de los metadatos en los 80.

La comunidad dedicada a la gestión de datos está interesada en la creación y control de los metadatos sobre conjuntos de datos: su procedencia, fuente de origen, las explicaciones de sus valores de campo, los controles de calidad, su ciclo de vida, etc. Los problemas son similares a los que se han planteado los profesionales de la información pero expresados con distinto lenguaje. Términos como el Master Data Management, Data Warehouse o ETL (Extrat Tranform Load)  presentan importantes sinergias con  planteamientos ya existentes en el records management:  control de las estructuras y la semántica, recuperación y explotación, migración…

También desde el ámbito legal, los expertos en “Discovery” claman por la preservación de metadatos necesarios para los casos de litigio en los tribunales. Se refieren en concretamente a metadatos sustantivos (que reflejan los cambios relevantes en los ítem de información) metadatos  del sistema (ej. nombre y extensión de los ficheros, tamaños, fechas de creación…), de los metadatos embebidos en los ítems digitales (ej. formulas, columnas ocultas, objetos insertados, etc.): para los propósitos del descubrimiento legal se hace necesario establecer el ámbito de los metadatos necesarios a preservar para los posibles casos judiciales (3)

Surgen nuevas miradas a la cuestión de los metadatos en el ámbito empresarial y en el contexto del Big  Content,  como las que propone Brian Bewer desde  Infolibrarian (4) o  Darin Steward en el prestigioso blog de Gartner (5)

Si estábamos ya inundados de propuestas de metadatos podemos esperar una nueva oleada procedente de los nuevos actores. Esta diversidad tiene su lógica, ya que los estándares de metadatos se han ido construyendo para el propósito de la comunidad a la que sirven y en ese sentido subyacen concepciones parciales y diferentes. Como ya  ocurrió en el s. XX con muchas piezas de la industria que se estandarizaron para poder ser intercambiables, se impone la necesidad de unificar los estándares para la gestión de los metadatos,  que son los nuevos tornillos de la industria de la información.

Los metadatos un elemento clave en el gobierno de la información

El uso de metadatos es esencial en los procesos de gestión y gobierno de la información:

  • Permiten la recuperación y el descubrimiento de los activos de información
  • Son un elemento clave para compartir información de forma eficiente
  • Son la espina dorsal de los servicios web y la interoperabilidad, la base para construir funciones avanzadas de computación distribuida.
  • Facilitan la reutilización y reelaboración incrementando el retorno de la inversión en los sistemas de datos.
  • Proporcionan control sobre las fuentes de datas y su calidad.
  • Ayudan a los usuarios a entender los datos, facilitando su transferencia e interpretación por nuevos usuarios sin necesidad de preguntar a los productores.
  • Reducen las cargas de trabajo, en especial a la hora de agregar datos de distintas fuentes y procedencias.
  • Permiten mantener consistencia en la terminología y semántica empleada
  • Ayudan a prevenir el uso inapropiado de los datos y a proporcionar protección y seguridad a aquellos datos que lo requieren
  • Permiten la reducción de costes globales al facilitar el empleo de herramientas que automaticen procesos de mantenimiento y populación de datos.

Podemos concluir, que los metadatos en sí mismos son evidencia de un buen gobierno de la información.

Pero ¿quién gobierna los metadatos?

Los negocios siguen imparables su evolución digital. En todos los campos de actividad se generan multitud de datos relativos a todas las transacciones que se producen; pero hay algo que falta: la adecuada planificación, gestión y control de los metadatos. Los  datos suelen estar muy pobremente documentados en casi todas las partes y los roles y responsabilidades en la materia no están claramente asignados en las organizaciones.

Hay mucho por hacer y la cuestión es lo suficientemente importante como para tomarse en serio su gobierno. Por un lado, si atendemos a los costes, es inviable mantener tales cantidades de datos sin sistemas de control de inventario de los datos.  Por otro lado, los metadatos están en el centro del debate social sobre la protección de la información y sus límites y pueden afectar a los valores de cumplimiento de los códigos éticos de conducta por parte de las empresas. La tremenda acumulación de información y las posibilidades de su uso  traspasa en muchos casos la frontera de lo aceptable, lo que implica para las empresas un riesgo legal y reputacional.

Los nuevos actores  de la gestión de los metadatos, provienen del campo de los datos y del mundo puramente TIC. Se mueven más cómodamente en unos entornos en los que hay que responder a necesidades de una información dinámica, ubicua y relacionada, pero llegan a un campo que es nuevo para ellos.

Los responsables de la gestión de la información los RIM (Records and Information Managers) llevan peleando desde hace años el terreno con escaso éxito. Como señala Barbara Reed (6) enfoques muy limitados han orientado la gestión de los metadatos hacia los objetos “muertos” o records fijados cuando ya no son útiles para la gestión del día; se han gastado muchos empeños y esfuerzos en desarrollar los elementos de metadatos a niveles detallados y exhaustivos que han consumido tiempo y recursos sin claros retornos de la inversión; se ha intentado en definitiva trasladar el pensamiento del mundo papel al entorno digital.  La norma ISO 23081 (7) ha sido de escasa o nula aplicación, pero tiene unos planteamientos conceptuales lo suficientemente sólidos como para ser aplicables de forma global al gobierno de la información y aporta el valor de un importante camino recorrido.

¿Quién será el responsable de garantizar en la empresa la gestión de metadatos? (8) Parece que hay coincidencia en que el punto clave está en convencer a las gerencias. Estas son, en última instancia, las responsables que deben apostar por las transformaciones tecnológicas que cada día requieren de forma más acuciante de políticas claras de gobierno de la información. Como indica un reciente estudio de la consultora MacKinsey (9) es necesario que las empresas cuenten con un liderazgo claro y centralizado en materia digital, que aglutine el talento para hacer frente a los nuevos retos que propone la tecnología y sea capaz de actuar de manera rápida y eficaz.

A día de hoy la información estructurada sigue siendo alrededor del 10% de lo que se almacena en una organización, por lo que el gobierno de los datos es sólo una parte del problema (10). La oportunidad de los profesionales de la información, para no perder definitivamente el escaso terreno ganado, está en la colaboración y el entendimiento con los data manager compartiendo y aportando experiencias enriquecedoras que permitan abrir nuevos caminos y dar soluciones prácticas y reales a los retos que se presentan. La necesidad existe y la industria ya está ahí para dar soluciones al problema. En el Gartner Magic Quadrant for Data Integration Tools (11) se pone de manifiesto la importancia de las capacidades de gestión de metadatos en las aplicaciones orientadas a la integración de datos. Estemos atentos a la evolución de este mercado, en el que se va a dirimir el futuro de los metadatos. Pero al igual que el gobierno de la información, el gobierno de los metadatos no es una cuestión que se solucione solamente con tecnología. Requiere de una visión global, una conceptualización clara y establecimiento de políticas, roles y responsabilidades.

 

Referencias

(1) Riley, Jenn; Work funded by the Indiana University Libraries. Design: Devin Becker.White Professional Development Award. Copyright 2009-2010  http://www.dlib.indiana.edu/~jenlrile/metadatamap

(2) Eckerson, Wayne: Common data vocabulary helps companies globalize governance, BI http://searchbusinessanalytics.techtarget.com/feature/Common-data-vocabulary-helps-companies-globalize-governance-BI

(3) Isaza, John. Metadata in Court: What RIM, Legal and IT Need to Know; ARMA Educational Foundation, November 2010

(4) Bewer, Brian. Building Blocks for Enterprise Metadata Management and Data Governance. http://www.infolibcorp.com/blog/author/brian-brewer

(5) Darin Stewart. Big Content Needs More Metadata. Mayo 2013 http://blogs.gartner.com/darin-stewart/2013/05/15/big-content-needs-more-metadata

(6) Barbara Red:  Metadata: a contestable concept? Seminar in honour of Hans Hofman, National Archives of the Netherlands, The Hague, January 27 2014 http://www.records.com.au/media/upload/barbara_reed_metadata_a_contestable_concepta.pdf

(7) UNE-ISO 23081-2:2011 Información y documentación. Procesos de gestión de documentos. Metadatos para la gestión de documentos. Parte 2 Elementos de implementación y conceptuales.

(8) Brian Bewer: Who’s Responsibility is Metadata Management? Infolibrarian. Febrero 2015 http://www.infolibcorp.com/blog/metadata-management-best-practices/whos-responsibility-is-metadata-management

(9) Henrik Andersson and Philip Tuddenham: Reinventing IT to support digitization. Mackinsey Insights & Publications. May 2014. http://www.mckinsey.com/Insights/Business_Technology/Reinventing_IT_to_support_digitization

(10) Robert F. Smallwood. The Confusion About Information Governance. Febrero 2016 https://www.linkedin.com/pulse/confusion-information-governance-robert-f-smallwood

(11)  The benefits of metadata and implementing a metadata management strategy. Enero 2016 http://searchitchannel.techtarget.com/feature/The-benefits-of-metadata-and-implementing-a-metadata-management-strategy

 

Elisa García-Morales Huidobro
Directora, Inforárea. Consultores en información y documentación
http://inforarea.es
[conectar para ver]
Miembro del think-tank Grupo ThinkEPI

Comentarios

Estimada Elisa,

En efecto, quienes llevamos trabajando en metadatos desde hace mucho tiempo hemos tenido que padecer el desconocimiento o la falta de interés (a mí me solían decir que hacía filosofía) hasta que el término empezó a utilizarse en los medios de comunicación como un mecanismo para revelar evidencias. Puede parecer un éxito, porque ahora todo el mundo conoce el valor de los metadatos. Sin embargo, como bien dices, hemos pasado de ignorar los metadatos a tener un disparatado número de ellos. Sólo puedo hablar desde la perspectiva de la gestión de documentos y archivo, que es mi especialidad, es decir, sólo puedo hablar desde la perspectiva de la rendición de cuentas, la responsabilidad y la gobernanza. Y, desde este punto de vista, debo decir que no creo que sea posible, ni siquiera deseable, que exista algo así como “controladores de metadatos”, más allá de los que se requieren para que algo sea evidencia de alguna otra cosa. ISO 23081 es un buen ejemplo. En nuestro entorno, también lo es el mal comprendido e-EMGDE. Pero, en la época del Big Data y en un marco tan enormemente distribuido y  autónomo, como he intentado explicar en otros lugares, ir más allá de leyes de mínimos es impensable. Antes al contrario: como también he intentado argumentar, creo que el gestor de documentos sólo puede trabajar en dos direcciones. En primer lugar, en la elaboración de una teoría de la “valoración de metadatos”, para que sólo permanezcan los que son útiles a efectos de responsabilidad y rendición de cuentas. En segundo lugar, en la tarea de descargar a los metadatos del enorme peso que durante años le hemos atribuido, y comenzar a trasladarlo a las relaciones. En condiciones ideales, sólo deberíamos tener IDs y relaciones. Los metadatos podrían en cierto modo “jubilarse”, o permanecer en activo estrictamente aquellos que permitan documentar los IDs y las relaciones para que puedan ser y seguir siendo evidencia. Digamos que deberíamos permitir que Internet fuera no sólo el archivo, sino también el archivero, y colocarnos en la humilde posición de un nodo entre otros muchos. Como digo, es una perspectiva muy cerrada, la de una disciplina concreta. Otras disciplinas desde luego tendrán otros puntos de vista, y ni siquiera estoy seguro de que otros colegas de profesión compartan mi punto de vista, que desde luego no es el único.

cordiales saludos

Alejandro Delgado Gómez
Archivero/Archivist
Servicio de Archivo y Bibliotecas del Ayuntamiento de Cartagena
Archivo Municipal
http://archivo.cartagena.es

Categorías

Archivos

Páginas