emergió para su uso
cuando el objetivo es
analizar los datos en
lugar de realizar
transacciones en
línea
la tecnología es un
factor clave en el
análisis interactivo
de grandes
cantidades de datos
para la toma de
decisiones
tienen tres importantes áreas de aplicación dentro de
análisis de datos
• Los almacenes de datos
Nota:
grandes
repositorios que integran los datos de varias fuentes en una empresa para el
análisis.
• Procesamiento analítico
en línea (OLAP)
Nota:
sistemas
proporcionan respuestas rápidas para las consultas que agregan grande cantidades
de datos detallados para encontrar tendencias generales.
• Aplicaciones de
minería de datos
Nota:
buscan
descubrir el conocimiento para
previamente patrones y relaciones en multidimensional desconocidos bases de
datos
Las hojas de cálculo
Nota:
son
una herramienta inadecuada para la gestión y almacenamiento de datos
multidimensionales porque vinculan datos almacenamiento demasiado firmemente a
la presentación-no lo hacen separar la información estructural de la deseada vistas
de la información.
base de datos estructurada
sistema ofrece una gran
flexibilidad en la
estructuración datos
proporcionan adecuada soporte para
un pequeño volumen de datos que
sólo tiene unas pocas dimensiones
Nota:
no lo hacen apoyar plenamente los requisitos de datos avanzada análisis
ver datos como cubos que generalizar
hojas de cálculo para cualquier número de
dimensiones
los cubos pueden gestionar
la incorporación de nuevos valores de dimensión
un cubo teóricamente puede tener cualquier
número de dimensiones
Generalmente, un cubo soporta la visualización
de sólo dos o tres dimensiones simultáneamente
dimensiones
son un concepto esencial y distintivo
Las dimensiones se utilizan para seleccionar y agregar datos
en el nivel de detalle deseado
Para evitar la duplicación de las definiciones, el cubo o
multidimensional de metadatos de base de datos define el
jerarquía de dimensiones
hechos
En la mayoría multidimensional modelos de datos, los hechos se
definen implícitamente por su combinación de valores de
dimensión
Los almacenes de datos comúnmente
incluyen tres tipos de hechos
Eventos
Modelo de instantáneas del estado de una
entidad en un punto dado en el tiempo
Instantáneas acumulados
medidas
propiedad numérica de un hecho, como el precio
de venta o ganancia
una fórmula, por lo general una función simple agregación tales como
suma, que puede combinar varias medidas valores en una sola.
consulta
consultas rebanada-y-dados hacen
selecciones a reducir un cubo
Consultas Drill-down y enrollables son inversas operaciones que
utilizan jerarquías de dimensiones y medidas para realizar
agregaciones.
Consultas de recorrer a través combinan cubos que
comparten un o más dimensiones
Clasificación o superior n / inferior n
Al girar un cubo permite a los usuarios ver los
datos agrupados por otras dimensiones.