archivo

Archivo de la etiqueta: modelo en estrella

Un poco de teoría.

No se recomienda la implementación de almacenes de datos corporativos (Datawarehouse) o almacenes sobre una problemática concreta del negocio de la organización (Datamarts) en el mismo sistema y/o espacio de los sistemas operaciones (OLTP: On-Line Transaction Processing), ya que requiere modelos de datos orientados a la consulta de la información (modelos en estrella o copo de nieve) y no se quiere interferir el funcionamiento de los sistemas transaccionales con la capacidad de proceso que requiere un proceso de ETL realizado sobre las tablas del operacional cada vez que se requiera una consulta o con la necesidad de proceso que se requiere para consultar la información si se está trabajando incluso con sistemas orientados a cubos.

Es decir, la teoría tradicional recomienda entornos distintos para los sistemas operacionales y para los sistemas orientados al soporte a la decisión, de manera que unos no influyan sobre los otros.

En los sistemas de soporte a la decisión, sobre todo aquellos orientados a los cuadros de mando y al análisis OLAP, la solución de modelado de datos se recomienda que esté orientada a modelos en estrella o copos de nieve, basados en la existencia de una o más tablas de hechos que muestran cada una de ellas un indicador a medir y las dimensiones, que no es otra cosa que los diferentes puntos de vista por los que se puede consultar un indicador, por ejemplo, punto de vista temporal, punto de vista geográfico, etc… Para sistemas orientados al reporting o al análisis puro y duro de la información es más recomendable otras soluciones, ya que en estos casos no resulta tan interesante la información agregada, siendo más importante tener la información en detalle.

Mi recomendación es que si se necesita una solución mixta, basada por un lado por cuadros de mando y análisis OLAP y por otro por reporting o análisis de la información, se implementen dos soluciones, una orientada a los modelos en estrella o modelos copo de nieve y otra basada en la desnormalización del modelo de datos operacional quedándonos solo con la información que se precisa o se prevé precisar para la confección de los listados o para la realización del análisis de la información.

En el caso de que la solución se base en cuadros de mando principalmente, querrá decir por regla general, que el tipo de usuario es de un perfil alto dentro de la organización, es decir, alta dirección, mando intermedio, etc… que requiera de un vistazo rápido mirar la evolución o el estado de una serie de indicadores.

Para el desarrollo de estos cuadros de mando es necesario que el usuario o usuarios que lo definan tengan claro qué objetivos de su organización o departamento quieren monitorizar y cuáles serán los indicadores que permitirán realizar el seguimiento de cada uno de esos objetivos. En esta tarea el analista tiene mucho que decir, ya que aunque el usuario tenga claro qué es lo que quiere, no siempre es fácil expresarlo, por lo que el analista, con su experiencia debe ayudar al usuario para que éste le suministre toda la información que necesita.

Para el desarrollo de cuadros de mando y otras soluciones complementarias como análisis OLAP (On-Line Analytical Processing), la mejor solución es la implementación de cubos (implementación de modelos de datos en estrella o copo de nieve), ya que lo que se requiere, por regla general en este tipo de sistemas es el trabajo con información agregada que pueda ser vista desde diferentes puntos de vista (dimensiones).

Como comenté en la primera entrada de esta serie, mi recomendación es que no utilicemos una solución excesivamente potente (que además suele ser cara) para dar solución a las necesidades de la empresa en materia de Business Intelligence, a no ser que desde el primer momento se detecte que se van a trabajar con centenas de millones de registros, en cuyo caso hay que optar por soluciones más potentes.

Podría valer con que si utilizamos Oracle (cuando digo Oracle, podría valer cualquier solución libre) como sistema de gestión de base de datos corporativo, se cree una nueva instancia en una máquina dedicada en la que se implementarán en los esquemas correspondientes los diferentes modelos de datos orientados al modelo en estrella o al modelo copo de nieve. Después se utilizarán las herramientas de explotación oportunas para presentar la información como cuadros de mando o para realizar el análisis OLAP (ROLAP en este caso).