Los datos, incluyendo las agregaciones, se almacenan dentro de una estructura relacional de base de datos que puede estar en la misma localización de la fuente o no.
DOLAP.
HOLAP.
MOLAP.
ROLAP.
Es cuando el resultado predicho se puede considerar un número real.
Árboles de clasificación.
Árboles de regresión.
Árboles de Decisión.
Son aquellos manejados por los gestores de base de datos convencionales, estos pueden ser considerados bidimensionales.
Hechos.
Jerarquías
Datos Relacionales.
Dimensiones.
Se encarga de medir las relaciones entre dos variables.
Análisis de clusters.
Análisis de regresión.
Análisis de factores
Análisis de correlaciones
Es una herramienta estadística que determina la relación entre dos o más variables cuantitativas.
Análisis de factores.
Análisis de correlaciones.
En el Modelo CRISP-DM, es donde obtenemos la vista minable o dataset
Comprensión de lo Datos.
Comprensión del Negocio.
Preparación de los Datos.
Es un tipo de red neuronal artificial, que es entrenada usando aprendizaje no supervisado para producir una representación discreta del espacio de las muestras de entrada, llamado mapa
Perceptrón Multicapa
Redes Kohonen.
Perceptrón.
En el Modelo CRISP-DM, es donde aplicamos las técnicas de minería de datos a los dataset.
Evaluación
Implantación.
Modelado
Operación de Minería de Datos, el cual está diseñado en un patrón similar de la experiencia de aprendizaje humano en el uso de observaciones para formar un modelo de las características importantes de alguna tarea.
Detección de Desviación
Modelado predictivo
Segmentación de Base de Datos
Análisis de Vínculos.
Entre los actores que intervienen en un proyecto de Data Mining, éste proporciona acceso al hardware, el software y los datos necesarios para completar el proyecto de minería de datos con éxito
Analista de minería de datos.
Líder del proyecto
Ingeniero de minería de datos
Cliente de minería de datos.
Analista de TI
Entre los actores que intervienen en un proyecto de Data Mining, éste desarrolla, interpreta y evalúa el modelo de minería de datos a la luz de los objetivos de negocio y criterios de éxito del negocio.
Ingeniero de minería de datos.
Analista de minería de datos
Su principal objetivo es el de brindar rápidas respuestas a complejas preguntas, para interpretar la situación del negocio y tomar decisiones.
Consultas ad-hoc
OLAP
Consultas empaquetadas.
Dashboards
Paso de la minería de datos donde se identifican los patrones obtenidos y que son realmente interesantes, basándose en algunas medidas y se realiza una evaluación de los resultados obtenidos.
Transformación de Datos.
Interpretación de los Resultados.
Minería de Datos.
Selección de Datos.
Se usa para ajustar datos que son función de diversas variables. El algoritmo básico puede formar un modelo para predecir el valor de un campo determinado partiendo de los valores de otros atributos.
Funciones de la Base Radial
Predicción Neuronal
Inducción Supervisada
Métodos Simbólicos
Crea un modelo que se utiliza para predecir nuevos valores y pronóstico de series temporales. La predicción se basa en un valor de predicción y en las relaciones entre los atributos descubiertas al explorar un conjunto de datos de preparación que contienen tanto la variable independiente como las dependientes.
Predicen un dato desconocido, a partir de la entrada o conjunto de valores obtenidos a lo largo de un tiempo determinado de los que se extrae un comportamiento futuro.
Su característica más importante es que son auto explicativos, a simple vista se puede observar la consideración de la clasificación de la data.
Modelo de proceso de selección, exploración y modelado de grandes cantidades de datos para descubrir patrones de negocio desconocidos.
Modelo Cascada.
Modelo CRISP-DM.
Modelo SEMMA.
En el Modelo CRISP-DM, es donde revisamos los modelos de las fases anteriores para determinar si son útiles a las necesidades del negocio.
Modelado.
Evaluación.
Presentan la información altamente resumida. Se componen de consultas, reportes, análisis interactivos, gráficos, semáforos, indicadores causa-efecto.
OLAP.
Se ejecutan periódicamente, sin necesidad de intervención de usuarios.
Dashboards.
Consultas ad-hoc.
Paso de la minería de datos el cual consiste en especificar los datos de entrada que se desean explorar y analizar
Selección de Datos
Transformación de Datos
Es la fase de modelado dónde métodos inteligentes son aplicados con el objetivo de extraer patrones previamente desconocidos, válidos, nuevos, potencialmente útiles y comprensibles y que están contenidos u “ocultos” en los datos.
Es la unidad básica de inferencia en forma de discriminador limitar o más simple, una neurona artificial. A partir de este se genera un algoritmo capaz de generar un criterio para seleccionar un sub género a partir de un grupo de componentes más grandes.
Perceptrón Multicapa.
Paso de la minería de datos el cual se encarga de las inconsistencias en los formatos de datos y la codificación, que pueden existir dentro de una base de datos única y que casi siempre existen cuando múltiples bases de datos contribuyen al Data Warehouse.
Permite almacenar una parte de los datos como en un sistema MOLAP y el resto como en uno ROLAP.
Segmentación de Base de Datos.
Detección de Desviación.
Esta herramienta constituye una poderosa tecnología con un gran potencial que ayuda y brinda soporte a los usuarios, con el fin de permitirles analizar y extraer conocimientos ocultos y predecibles a partir de los datos almacenados en un DW o en un OLTP.
Data Mining.
Es cuando el resultado predicho es la clase a la que pertenecen los datos.
El objetivo es crear un modelo que predice el valor de una variable de destino en función de diversas variables de entrada.
Árboles de Decisión
Es un tipo de red neuronal artificial, que es entrenada usando aprendizaje no supervisado para producir una representación discreta del espacio de las muestras de entrada, llamado mapa.
Redes Kohonen
Entre los actores que intervienen en un proyecto de Data Mining, éste entiende a fondo, desde un punto de vista comercial, lo que el cliente quiere lograr.
Analista de TI.
Paso de la minería de datos el cual consiste en especificar los datos de entrada que se desean explorar y analizar.
Los datos de fuente son almacenados en un formato multidimensional.
Jerarquías.
Son redes neuronales artificiales formadas por múltiples capas, esto les permite resolver problemas que no son linealmente separables.
Posibilidad de cambiar la granularidad de los datos.
Slice y Dice.
Pivot.
Drill down y Roll up.
Modelo CRISP-DM
En el Modelo CRISP-DM, es donde se definen los objetivos y requerimientos desde una perspectiva no técnica.
Son consultas frecuentes y aleatorias, en el sentido en que responden a necesidades de información concretas.