archivo

Archivos diarios: abril 4, 2010

Realmente lo complicado de un proyecto de estas características se encuentra en el proceso que da lugar a la construcción del almacén de datos, ya que en ese proceso, como hemos visto intervienen las siguientes tareas:

– Definición (si no existe) de la metodología de modelado de Datamarts y de la estrategia de documentación de los mismos (sobre el aspecto de la documentación, es importante que permita realizar una trazabilidad de un indicador desde la fuente del dato hasta el almacén de datos, e incluso si se explota con listados, cuadros de mando, etc…, extender la trazabilidad hasta los mismos).
– Identificación y priorización de los indicadores.
– Identificación y estudio de las fuentes de información.
– Definición de políticas en la organización que responsabilicen a aquellas personas que tienen que cargar los datos en las fuentes y entregarlas (en el caso de fuentes ofimáticas) a que lo hagan con la mayor calidad y rigurosidad posible (esto será difícil de conseguir para todos los tipos de fuentes, pero incluso conociendo eso es necesario que existan unas instrucciones, ya que de esta forma se conseguirán mejores resultados (aún siendo incompletos) que sin la existencia de las mismas)., que informen de modificaciones en las fuentes del dato, etc…
– Modelado de los datos en el almacén, teniendo en cuenta criterios como por ejemplo: la integración de datos, la facilidad de explotación tanto por herramientas de exploración de datos, como por parte de otras estrategias, como por ejemplo, cuadros de mando, listados, etc…
– Construcción de los ETLs e incluso y en ocasiones de herramientas de preprocesado de las fuentes antes de ser procesadas por los ETL.

Dado que todas y cada una de esas tareas tiene su complejidad, resulta lógico pensar que realmente la dificultad se centra en la concepción y construcción del datawarehouse (o del datamart) y que la explotación, aún siendo importante, no resulta significativa en términos de dificultad teniendo en cuenta todos los obstáculos que hay que sortear hasta tener disponible el almacén de datos.

Como sucede en el caso de los indicadores, el establecimiento de los mecanismos de explotación, también requiere un trabajo importante con el usuario, ya que la estrategia a aplicar en cada caso debe ser aquella que simplifique al mismo la obtención de la información que precisa. Si el usuario no puede obtener los datos que requiere con relativa facilidad, terminará prescindiendo de intentar conseguir de esta manera la información que necesita. De igual manera, resulta muy importante, la realización de actividades de formación, como el establecimiento de mecanismos de soporte.