Identificar patrones válidos, novedosos, potencialmente útiles y, en última instancia, comprensibles en los datos
convertir datos de bajo nivel en conocimiento de alto nivel.
Nota:
Datos en los cuales ya transformados seran mas faciles de manipular y extraibles.
En minería de datos
Nota:
Aunque es el núcleo del proceso de descubrimiento de conocimientos, este paso suele requerir solo una pequeña parte. por lo tanto, la minería de datos es solo un paso en el proceso general de KDD.
Otros pasos para el descubrimiento de conocimientos
* Desarrollar una comprensión del dominio de la aplicación
y los objetivos del proceso de minería de datos.
* Adquirir o seleccionar un conjunto de datos de destino
* Integrar y verificar el conjunto de datos
problemas con la base de datos?
Cualquier proceso de descubrimiento de conocimiento realista no es lineal, sino iterativo e interactivo.
Cualquier paso puede resultar en cambios en los pasos anteriores, produciendo así una variedad de
ciclos de retroalimentación. Esto motiva el desarrollo de herramientas que respalden todo el proceso
KDD, en lugar de solo el paso central de extracción de datos. Dichas herramientas requieren una
estrecha integración con sistemas de bases de datos o almacenes de datos para la selección,
preprocesamiento, integración, transformación, etc. de datos.
Nota:
Muchas de las herramientas disponibles actualmente son herramientas genéricas de la comunidad de inteligencia artificial o estadísticas. Por lo general, estas herramientas funcionan por separado de la fuente de datos, lo que requiere una cantidad significativa de tiempo dedicado a la exportación e importación de datos, el procesamiento previo y posterior y la transformación de datos