Metodología de Ralph
Kimball para la
Implementación de
DW/BI - por: Marisol Cañas
Es
Llamada modelo bidimensional, se basa en lo
que se denomina ciclo de vida dimensional
del negocio. Esta metodología es considerada
una de las técnicas favoritas a la hora de
construir sistemas DataWarehouse y Business
Intelligence
Un DataWarehouse
es:
Una base de datos corporativa centralizada
que contiene datos y metadatos denominados
objetos, cuyo propósito es el desarrollo de
procesos analíticos y de consultas variadas
basados en implementación de modelos o
estructuras multidimensionales,
multitabulares, también denominadas cubos
o datamarts cuyo resultado sirve para el
apoyo a la toma de decisiones
Recomendaciones para seguir la
Metodología Kimball en la
implementación de sistemas DW
Seguir una metodología probada
(Metodología del Ciclo de Vida Kimball)
Comprender con mucha claridad los requerimientos
del negocio para poder traducirlos en un modelo de
datos priorizando los esfuerzos y dando valor
agregado a la organización
Diseñar las áreas de datos del DW a
modo de hacerlo flexible, reusable y
con alto nivel de performance
Implementar en forma rápida y progresiva
incrementos basados en procesos de negocios que
conforman la Matriz de Datos Empresariales (Matriz Bus de DW)
Diseñar una arquitectura DW que responda a los
procesos del negocio, a los volúmenes de datos, y a
la infraestructura de TI
Construir la solución ETL de extracción, transformación y carga con componentes
estandar para poder manejar los modelos de diseño. Estandares que se utilizan en las
plataformas de analítica de datos Externos
Entregar una solución completa que incluya reportes, programas
de consulta, portales, documentación, entrenamiento y soporte
El Ciclo de Vida de Kimball es:
una metodología detallada para el diseño , desarrollo e
implementación de sistemas de Business Intelligence y
DataWarehouse. El ciclo de vida es un enfoque iteractivo
en la que en cada pasada se generan un conjunto
coherente de datos y estructuras de datos de un conjunto
de informes y aplicaciones analíticas asociadas. Cada ciclo
de iteración puede ser terminado en un periodo de seis a
nueve meses dependiendo de la complejidad de los
procesos de análisis y datos
La implementación del Sistema
DataWarehouse - Business Intelligence
pude tomar multiples iteraciones cada
una de las cuales carga nuevos
contenidos de datos, es decir, objetos
de datos, estructuras
multidimensionales o aplicaciones de Bi
que estan relacionadas con la matriz de
datos de la empresa denominada
matriz bus
La matriz bus es:
Representa el modelo de análisis del
sistema Business Intelligence -
DataWarehouse
Análisis de requerimientos
La definición de los requerimientos es en gran medida un
proceso de entrevistar al personal de negocio y técnico,
pero siempre conviene tener un poco de preparación
previa. Se debe aprender tanto como se pueda sobre el
negocio, los competidores, la industria y los clientes del
mismo. Hay que leer todos los informes posibles de la
organización; rastrear los documentos de estrategia
interna; entrevistar a los empleados, analizar lo que se
dice en la prensa acerca de la organización, la
competencia y la industria. Se deben conocer los términos
y la terminología del negocio.
Planificación del Proyecto
En este proceso se determina el propósito del
proyecto de DW/BI, sus objetivos
específicos y el alcance del mismo, los
principales riesgos y una aproximación
inicial a las necesidades de
información.
Esta tarea incluye las siguientes acciones
típicas de un plan de proyecto: * Definir el
alcance (Entender los Requerimientos del
Negocio) * Identificar las tareas *Programar las
tareas * Planificar el uso de los recursos
* Asignar la carga de trabajo a los recursos
*Elaboración de un documento final que
representa un plan del proyecto
Modelado Dimensional
El proceso de diseño comienza con un
modelo dimensional de alto nivel obtenido
a partir de los procesos priorizados de la
matriz. El proceso iterativo consiste en cuatro pasos:
* Elegir el Proceso de Negocio * Establecer el
Nivel de Granularidad * Elegir las
Dimensiones * Identificar medidas y las
tablas de hechos
Diseño Físico
¿Cómo puede determinar cuán grande
será el sistema de DW/BI? ¿Cuáles son los
factores de uso que llevarán a una
configuración más grande y más compleja?
¿Cómo se debe configurar el sistema?
¿Cuánta memoria y servidores se
necesitan? ¿Qué tipo de almacenamiento y
procesadores? ¿Cómo instalar el software
en los servidores de desarrollo, prueba y
producción? ¿Qué necesitan instalar los
diferentes miembros del equipo de DW/BI
en sus estaciones de trabajo? ¿Cómo
convertir el modelo de datos lógico en un
modelo de datos físicos en la base de datos
relacional? ¿Cómo conseguir un plan de
indexación inicial? ¿Debe usarse la
partición en las tablas relacionales?
DISEÑO DEL SISTEMA DE
EXTRACCIÓN,
TRANSFORMACIÓN Y
CARGA (ETL)
Es la base sobre la cual se alimenta el
Datawarehouse. Si el sistema ETL se diseña
adecuadamente, puede extraer los datos de los
sistemas de origen de datos, aplicar diferentes
reglas para aumentar la calidad y consistencia de
los mismos, consolidar la información proveniente
de distintos sistemas, y finalmente cargar (grabar)
la información en el DW en un formato acorde para
la utilización por parte de las herramientas de
análisis.
ESPECIFICACIÓN Y
DESARROLLO DE
APLICACIONES BI
Las aplicaciones de BI son la cara visible de la inteligencia
de negocios: los informes y aplicaciones de análisis
proporcionan información útil a los usuarios. Las
aplicaciones de BI incluyen un amplio espectro de tipos de
informes y herramientas de análisis, que van desde
informes simples de formato fijo a sofisticadas,
aplicaciones analíticas que usan complejos algoritmos e
información del dominio. Kimball divide a estas
aplicaciones en dos categorías basadas en el nivel de
sofisticación, y les llama informes estándar y aplicaciones
analíticas
Implementación
Representa la convergencia de la tecnología, los datos y las aplicaciones de
usuarios finales accesible desde el escritorio del usuario del negocio.
Existen varios factores extras que aseguran el correcto funcionamiento de
todas estas piezas, entre ellos se encuentran la capacitación, el soporte
técnico, la comunicación y las estrategias de feedback