archivo

Archivo de la etiqueta: La oscura era digital

Volviendo a un tema que toqué en diversos artículos desde que publiqué mis reflexiones sobre el documental “La oscura era digital” os comento una breve charla que tuve con la responsable de archivo de mi organización.

Resulta que un departamento quiere hacer una limpia importante de documentos que no tienen trascendencia, pero que como suele pasar en estos casos, cuesta deshacerse de ellos por si en algún momento fuera necesario acudir a ellos. Como buena parte de los mismos procedían de listados de un sistema de información actualmente sustituido por otro y en el proceso de migración se mapearon los datos origen a otros distintos (para mejorar, entre otras cosas, la calidad de los mismos), los responsables del departamento querían conservar una copia en el archivo de mi organización, de los datos de la aplicación antigua, los cuales se encuentran todavía en la base de datos de explotación ya que el cambio de sistema se realizó no hace excesivo tiempo y por si acaso, queremos tenerlo a mano por si hiciera falta acudir a ellos (tampoco hubiera habido problema si se hubiera decidido tenerlo almacenado en cinta).

Traté de explicarles que en informática nos encargaríamos de hacer una copia del esquema de base de datos cuando se vaya a quitar de producción pero como es lógico, ellos querían tocar pelo y tener custodiado en el archivo una copia en soporte digital en el archivo. Al fin y al cabo los responsables de los datos son ellos y si prefieren hacerlo así, poco más allá puedo ir.

Una vez que finalmente decidieron la opción del archivo, la responsable de archivo me pidió un manual que permitiera que a partir de la información almacenada en el soporte físico se pudiera recuperar la información en el caso de que sea necesario. Esto puede parecer una petición lógica, pero, ¿se nos habría ocurrido a nosotros?, ¿se nos habría ocurrido qué tal vez dentro de de bastantes años sea necesario recuperar esa información y tal vez la tecnología de base de datos utilizada ya no sea la predominante o bien exista otros paradigmas de almacenamiento de datos?. Lo que parece trivial no lo es tanto y lo expone perfectamente el documental “La oscura era digital”.

Un aspecto muy importante cuando se está trabajando con documentos electrónicos es la gestión documental, ya que si queremos poder localizar un documento en el futuro, relacionarlos con otros que traten sobre una determinada temática y abrirlos (ya he hablado de este asunto en varios posts, como por ejemplo el que denominé La oscura era digital).

Es decir si estamos trabajando con documentos electrónicos la solución no debe consistir solo en persistirlos (ya sea en una base de datos, en un sistema de ficheros o utilizando como puente un gestor documental), sino que si se quiere tener una visión orientada a la conservación con el tiempo de los mismos, así como facilitar su localización, hay aplicar técnicas rigurosas de gestión documental.

En el ámbito de la gestión documental, como en tantos otros, tengo muchísimo que aprender, pero hay varios aspectos muy importantes que se deben tener en cuenta a la hora de abordar una gestión documental basada en documentos electrónicos:

– La estrategia debería ser global en toda la organización, huyendo en la medida de lo posible de soluciones particulares, ya que al fin y al cabo la documentación es la que instancia el conjunto de procesos de la organización y por este motivo es necesario que el almacenamiento de toda la documentación siga una misma estrategia.

– La estrategia global es recomendable que sea definida junto a expertos en gestión documental (si no se dispone en la organización de personal con esos conocimientos, será necesario contratar esa consultoría).

– Si no es posible abordar todavía la estrategia global (se puede aplazar, pero es necesario realizarla, teniendo en cuenta los posibles gastos de migración desde las soluciones particulares a la general definitiva que se establezca), es necesario adoptar estrategias particulares que minimicen los posibles costes de migración a una estrategia global y que además faciliten la localización, asociación y persistencia de la documentación. Entre esas estrategias, debería estar la utilización de un estándar de metadatos (no es cuestión de inventarse una estructura si existen varias especificaciones con características de estándar ya disponibles), el establecimiento de una política de cumplimentación de los metadatos (minimizando los procesos de grabación manual) y el almacenamiento de la documentación en formatos abiertos, conocidos y estandarizados.

La gestión documental es algo muy serio y aunque tal vez a corto, medio o incluso largo plazo no se puedan ver las nefastas consecuencias de una mala política de gestión documental, es muy probable que a muy largo plazo las consecuencias negativas sean palpables y sea complicado (o tremendamente costoso) revertir la situación.

Lo que más puede llamar la atención es el concepto de portabilidad, un ejemplo sencillo, en casa utilizo la distribución Linux Ubuntu, en el trabajo Windows, si quisiera instalar Microsoft Office en mi PC doméstico (suponiendo que tuviera la licencia oportuna) no podría (quitando otras posibles soluciones como tener un sistema operativo Windows como máquina virtual, Wine, etc…), este ejemplo es extensible a una gran cantidad de software que funciona en unos sistemas operativos y que en otros no (salvo que se rehaga completamente). La portabilidad se puede ver desde diferentes puntos de vista, portabilidad a nivel de código fuente, es decir, tener una aplicación que sin tocar el código fuente pueda funcionar en diferentes sistemas operativos mediante su compilación en los mismos, portabilidad a nivel de ejecutable o de software interpretable, la están proporcionando las soluciones basadas en máquinas virtuales, como por ejemplo Java, Mono, etc…, portabilidad de datos, etc… La portabilidad es, a mi juicio, una de las causas que está afectando al impulso definitivo de Linux, ya que la cantidad de software disponible en Windows y Mac (sobre todo en el primero y sobre todo a nivel de diferentes opciones a elegir) es sensiblemente superior. No obstante, la orientación del uso de aplicaciones en la nube y la aparición de cada vez más software en Linux, puede romper esa tendencia.

La portabilidad de la información no es un concepto que debamos dejar de lado, ya publiqué hace un tiempo un artículo que lleva el mismo nombre que el documental que me inspiró el mismo “La oscura era digital”. Es muy importante, si queremos que la información persista en el tiempo que el formato lógico en que se almacena se base en un estándar abierto, de lo contrario si queremos persistir la información, necesitaremos tener una copia del programa que lo interpreta y si el sistema operativo en el que se ejecuta tampoco es abierto una copia de dicho sistema operativo y así sucesivamente hasta llegar al hardware más básico de la máquina en que se ejecuta el software.

En resumen, los sistemas abiertos surgieron como una necesidad, casi como un mecanismo de defensa ante una evolución de la industria de las TIC que no era coherente para sus organizaciones usuarias, esta necesidad cambió las reglas del mercado y propició una importante evolución en el mundo de la informática que no hubiera sido posible (o por lo menos hubiera sido mucho más lenta) de otra forma. La estandarización, las especificaciones abiertas, fueron la llave de todo.

En la actualidad, pese a que los sistemas abiertos es una filosofía aplicada de forma general en el mundo de las TICs, en la actualidad y en el futuro existirán muchos productos hardware y software de uso cotidiano que no tienen publicadas sus especificaciones. La tendencia estratégica de estos y otros fabricantes dependerá muy mucho de las reglas del juego que queremos los usuarios que existan.

¿Persistirá la información digital que actualmente se encuentra dispersa en infinidad de soportes?, en el caso de que persista, ¿se dispondrán de los medios adecuados para leer e interpretar dicha información?. Si no se hace nada al respecto, esta era (la actual) será una época oscura sobre la que no quedó rastro de lo que sucedió en la misma, si se intenta buscar información de la misma dentro de miles de años. Sobre esta base gira el documental “La oscura era digital” (del año 2003) que tuve la oportunidad de ver hace unos días.

Pese a que vi el documental desde una posición un tanto excéptica a sus plantemientos (ya que me pareció excesivamente alarmante, teniendo en cuenta de que gran parte de la información (y mucha de ella muy relevante) sigue (y seguirá teniendo aunque cada vez menos), su reflejo en medios físicos: libros, periódicos, etc…) y que tardé en abrir un poco la mente, al final me quedé con la moraleja de que es necesario de alguna manera buscar la persistencia de la información, pensando en ella no como un bien que necesito mantener en el presente, sino como un bien que se necesita consultar en un futuro (mirando este como algo a muy largo plazo), para ello no basta solo con almacenar los bits de información (que ya de por sí es algo costoso, no solo por su mantenimiento, sino por la sucesiva migración de los soportes que los contienen (la tecnología tiene eso, un avance continuo y progresivo que hace que cada cierto tiempo aparezca una nueva que desbanca a la anterior)), sino que además es necesario persistir la manera en que se interpreta ese conjunto de ceros y unos (sin esas interpretaciones no tenemos nada, simplemente ceros y unos sin sentido)).

Para poder persistir esa interpretación existen diversas posibilidades como por ejemplo almacenar el conjunto de programas y aplicaciones informáticos que permiten interpretarlos (sería algo así como tener un Arca de Noé de software), algo que es complejo debido a la gran cantidad de software que se genera y manteniente a lo que hay que sumar que también habría que almacenar en el arca los sistemas operativos sobre los que funcionaban y una emulación de cada uno de los sistemas físicos que lo soportaban (o disponer de un Arca de Noé del hardware). No obstante, la posibilidad más lógica es persistir la especificación de los formatos de los ficheros lógicos, para ello en primer lugar los formatos deben ser abiertos y por tanto conocidos (sin formatos abiertos esta posibilidad no existe para gran cantidad de información digital, de hecho, gran parte de la información almacenada en formato digital corre el riesgo de no ser interpretada en un futuro, al no ser abiertos sus formatos (lo que hace que o se tiene el software que lo interpretaba (Arca de Noé del software) o no hay nada que hacer (salvo intentar descifrarlo, algo que puede resultar bastante costoso)).

Tras la visión del documental, tengo más claro que nunca que debemos dirigirnos lo más rápido posible al uso de software que permita almacenar ficheros (audio, video, texto, imágenes, etc, etc, etc….) siguiendo especificaciones abiertas, de hecho a la mañana siguiente solicité una serie de modificaciones en el libro blanco de desarrollo de mi organización en lo que se refiere a la documentación de los proyectos (más adelante, no depende de mi, intentaré abordar un tema más complejo como es el de la información documental generada por los sistemas de información, ya que ésta también deberá seguir la filosofía de utilizar soluciones que tengan especificaciones abiertas).