KDD

Description

Knowledge Discovery in Databases
RUBEN LADRON DE G
Mind Map by RUBEN LADRON DE G, updated more than 1 year ago
RUBEN LADRON DE G
Created by RUBEN LADRON DE G over 5 years ago
190
0

Resource summary

KDD
  1. Definición: Kamber (2011), proceso de descubrir conocimiento potencialmente útil dentro de datos. Webmining (2011) resalta que es un proceso que explora volúmenes grandes de datos para determinar relaciones. Extrae información de calidad para dibujar conclusiones basadas en relaciones o modelos.
      1. Necesidades: Aumento de volumen y variedad en información dentro de bases de datos, así como distintas y nuevas fuentes donde se encuentran los datos. Necesidad importante por integrar el conocimiento para toma de decisiones importantes y complejas. Algunas áreas de aplicación:
        1. Medicina
          1. Marketing
            1. Trafico
              1. Etcétera
              2. Procesos:
                1. Fase 1- a)Determinar: fuentes de datos útiles b)Forma de obtención de dichas fuentes c)Homologar formato de información (resolver inconsistencias) y d)Generar almacén de datos
                  1. Fase 2- Eliminación y corrección de datos incorrectos o faltantes. Determinar variables o atributos relevantes para la minería de datos. Construcción de atributos. Determinar muestras estadísticas.
                    1. Fase 3- Generar nuevo conocimiento a partir de métodos y algoritmos y extraer el conocimiento de bases de datos. Tenemos tres pasos: Determinar las tareas, determinar el método y seleccionar el algoritmo.
                      1. Tipo de tareas: Predictivas (Clasificación, Regresión) o Descriptivas (Agrupamiento, correlación, reglas asociación, asociación secuencial)
                        1. Métodos- Nos permiten resolver tareas, algunos importantes son: Inferencia, estadística, árboles de decisión, redes neuronales, inducción de reglas, algoritmos genéticos, basados en núcleos, aprendizaje bayesiano.
                        2. Fase 4- Evaluación de la calidad de lo descubierto mediante distintos criterios. La elección de la evaluación del método dependerá de la técnica elegida. Resaltamos dos actividades: Evaluación de patrones y análisis de expertos y evaluación y entendimiento del contexto real en el cual se usará el método.
                          1. Conjuntos de datos: Entrenamiento y Prueba
                            1. Modelos: Validación simple, Cruzada, Bootstrapping
                            2. Fase 5- Monitoreo y uso que genere acciones valiosas. Cuantificar los resultados. Buscar incoporarla en el contexto laboral para facil adopción.
                            Show full summary Hide full summary

                            Similar

                            DESCUBRIMIENTO DEL CONOCIMIENTO EN BD (KDD)
                            Antonio Nicolás García
                            ARQUITECTURA DE UNA BD INTELIGENTE
                            Yolanda Eloisa S
                            El Túnel
                            Jose Guerrero
                            A-level Sociology Quiz
                            Chuck Amobi
                            To Kill a Mockingbird Key Themes and Quotes
                            Matthew T
                            GCSE AQA Chemistry - Unit 3
                            James Jolliffe
                            Evolution
                            rebeccachelsea
                            AQA AS Biology Unit 2 DNA and Meiosis
                            elliedee
                            AQA Biology 12.1 cellular organisation
                            Charlotte Hewson
                            General Pathoanatomy Final MCQs (201-300)- 3rd Year- PMU
                            Med Student