KDD

Description

Knowledge Discovery in Databases
RUBEN LADRON DE G
Mind Map by RUBEN LADRON DE G, updated more than 1 year ago
RUBEN LADRON DE G
Created by RUBEN LADRON DE G over 5 years ago
199
0

Resource summary

KDD
  1. Definición: Kamber (2011), proceso de descubrir conocimiento potencialmente útil dentro de datos. Webmining (2011) resalta que es un proceso que explora volúmenes grandes de datos para determinar relaciones. Extrae información de calidad para dibujar conclusiones basadas en relaciones o modelos.
      1. Necesidades: Aumento de volumen y variedad en información dentro de bases de datos, así como distintas y nuevas fuentes donde se encuentran los datos. Necesidad importante por integrar el conocimiento para toma de decisiones importantes y complejas. Algunas áreas de aplicación:
        1. Medicina
          1. Marketing
            1. Trafico
              1. Etcétera
              2. Procesos:
                1. Fase 1- a)Determinar: fuentes de datos útiles b)Forma de obtención de dichas fuentes c)Homologar formato de información (resolver inconsistencias) y d)Generar almacén de datos
                  1. Fase 2- Eliminación y corrección de datos incorrectos o faltantes. Determinar variables o atributos relevantes para la minería de datos. Construcción de atributos. Determinar muestras estadísticas.
                    1. Fase 3- Generar nuevo conocimiento a partir de métodos y algoritmos y extraer el conocimiento de bases de datos. Tenemos tres pasos: Determinar las tareas, determinar el método y seleccionar el algoritmo.
                      1. Tipo de tareas: Predictivas (Clasificación, Regresión) o Descriptivas (Agrupamiento, correlación, reglas asociación, asociación secuencial)
                        1. Métodos- Nos permiten resolver tareas, algunos importantes son: Inferencia, estadística, árboles de decisión, redes neuronales, inducción de reglas, algoritmos genéticos, basados en núcleos, aprendizaje bayesiano.
                        2. Fase 4- Evaluación de la calidad de lo descubierto mediante distintos criterios. La elección de la evaluación del método dependerá de la técnica elegida. Resaltamos dos actividades: Evaluación de patrones y análisis de expertos y evaluación y entendimiento del contexto real en el cual se usará el método.
                          1. Conjuntos de datos: Entrenamiento y Prueba
                            1. Modelos: Validación simple, Cruzada, Bootstrapping
                            2. Fase 5- Monitoreo y uso que genere acciones valiosas. Cuantificar los resultados. Buscar incoporarla en el contexto laboral para facil adopción.
                            Show full summary Hide full summary

                            Similar

                            DESCUBRIMIENTO DEL CONOCIMIENTO EN BD (KDD)
                            Antonio Nicolás García
                            ARQUITECTURA DE UNA BD INTELIGENTE
                            Yolanda Eloisa S
                            El Túnel
                            Jose Guerrero
                            Shapes of molecules and intermolecular forces
                            eimearkelly3
                            GRE Word of the Day
                            SAT Prep Group
                            A-level Sociology Quiz
                            Chuck Amobi
                            English Language Techniques
                            Zakiya Tabassum
                            HISTOGRAMS
                            Elliot O'Leary
                            Biology AS Level UNIT 1
                            Valentin Andrei
                            Anatomie - sistemul digestiv 1
                            Eugeniu Nicolenco