PREPROCESAMIENTO Y CALIDAD DE DATOS

Descripción

BIG DATA
LINA CHAVARRO GUTIERREZ
Fichas por LINA CHAVARRO GUTIERREZ, actualizado hace más de 1 año
LINA CHAVARRO GUTIERREZ
Creado por LINA CHAVARRO GUTIERREZ hace casi 7 años
9
0

Resumen del Recurso

Pregunta Respuesta
PREPROCESAMIENTO Y CALIDAD DE DATOS Tecnologías como Internet generan datos a un ritmo exponencial gracias abaramiento y gran desarrollo del almacenamiento y los recursos de red. ASPECTOS IMPORTANTES Se caracteriza los datos masivos son la veracidad de los datos y el valor intrínseco del conocimiento extraído.
CARACTERÍSTICAS La veracidad y el valor de los datos y cuyo objetivo es filtrar el ruido y mantener los datos valiosos que pueden ser utilizados para la toma de decisiones inteligentes. PREPROCESAMIENTO DE DATOS Es una etapa esencial del proceso de descubrimiento de información. -Se encarga de la limpieza de datos, su integración, transformación y reducción para la siguiente fase de minería de datos.
LA PREPARACIÓN DE LOS DATOS El sistema prepara las bases de los datos que serán utilizados durante todo el ciclo del proceso en sus diferentes etapas. BIG DATA La necesidad de procesar y extraer conocimiento valioso de tal inmensidad de datos se ha considerado en un desafió considerable para científicos de datos y expertos en la materia.
SPARK es perfecto para procesos iterativos donde un mismo dato es reutilizado varias veces para el procesamiento de algoritmos sobre grafos, etc. ALGORITMOS PREPROCESAMIENTO DE DATOS MASIVOS En esta subseccion mostramos brevemente los algoritmos de preprocesamiento disponibles en las herramientas de analítica de datos previamente descritas.
REDUNDANCIA ACUMULADA Desarrolla una aproximación voraz al problema de calculo de importancia de atributos. REUTILIZACION DE CÁLCULOS PREVIOS Almacena para su reutilizacion algunos datos importantes cuando son calculados por primera vez.
PROCESAMIENTO POR COLUMNAS Normalmente formando una lista de filas son transformados a unas lista de columnas de manera que los cálculos entre atributos se tornan mas sencillos de realizar. CONCLUSIONES Este trabajo se estudia la creciente importancia del preprocesamiento de datos en Big Data. Se presenta una revisión de las tecnologías de Big Data herramientas analíticas de datos y técnicas y algoritmos disponibles para el preprocesamiento de datos masivos.
Mostrar resumen completo Ocultar resumen completo

Similar

Capitulo 6
Pau Eliza
Inglés - Verbos Compuestos I (Phrasal Verbs)
maya velasquez
Consecuencias de la guerra civil
ignaciobll
Matrices y Determinantes
Diego Santos
Fichas de formulas de Cinematica DE FISICA
Omar Vazquez Flores
Elaboración de mapas mentales
Reyna Elisa Delg
Pasos para la ejecución de un emprendimiento
lamconsultoria
Sistema Nervioso
Salim Cueter Paternina
como elaborar un mapa mental
Maria Gineth Arenas
Organizador Gráfico
r2p2casa
INGLÉS-Diminutas...
Ulises Yo