BIG DATA: PROCESAMIENTO Y CALIDAD DE DATOS
Gracias al desarrollo del Internet ;nuestros datos tienen mayor volumen , velocidad y variedad.
smart data: gira alrededor de dos im-
portantes características, la veracidad y el
valor de los datos, cuyo objetivo es filtrar
el ruido y mantener los datos valiosos.los cuales son necesarios para la toma de decisiones importantes.
El uso de los datos: a) los datos deben ser
lo que se dice, es importante la calidad de
datos; b) los datos deben ser escalables para
su procesamiento; c) los datos deben estar
disponibles y preparados para adaptarse;estas son características para datos exactos procesables y ágiles.
BIG DATA:
*volumen
*variedad
*veracidad
*valor
*velocidad
“La preparación de datos está formada por una serie de técnicas que tienen el objetivo de inicializar correctamente los datos que
servirán de entrada para los algoritmos de minería de datos”
La necesidad de procesar y extraer conocimiento
valioso de tal inmensidad de datos
se ha convertido en un desafío considerable
para científicos de datos y expertos en la
materia.
Una contribución reseñable para el preprocesamiento de datos masivos,
y en particular, para selección de atributos, es el algoritmo fast-mRMR .
Smart Data son datos de calidad, prestos
para ser utilizados en la extracción de conocimiento y la toma de decisiones inteligente basada en datos.