Es un campo interdisciplinario donde se utiliza métodos, procesos, algoritmos y tecnologías de información para conseguir el valor de los datos con el objetivo de responder algo.
Las preguntas que podemos plantearnos son “qué pasó”, “por qué pasó”, “qué pasará” y “qué se
puede hacer con los resultados”.
Relación con películas
Margin Call
Se utilizan datos para saber la eficacia de un proceso y se hace una estimación de las perdidas en la empresa
The Big Short
Con los datos el protagonista predice el futuro del mercado y toma una decisión
Analítica de datos
Se utiliza para el descubrimiento, interpretación y comunicación de patrones significativos de los datos
Para la toma de decisiones efectivas
Es el analisis de los datos o estadísticas usando sistemas computacionales
Big Data
Son datos que contienen una mayor variedad y se presentan en volúmenes crecientes y a mayor velocidad
Se le conoce como "las tres V"
Datos masivos mayormente no estructurados
Puede ocupar terabytes y petabytes de espacio de almacenamiento en diversos formatos, incluidos
texto, vídeo, sonido, imágenes y más.
Metodología CRISP DM
Aplicación para la ciencia de datos
Fases de esta metodología
Fase 1. Entendimiento del negocio
Etapas
Identificación de los objetivos del negocio
Evaluación de la situación
Definición de los objetivos para la analítica minería de datos