PREPROCESAMIENTO Y CALIDAD DE DATOS

Description

BIG DATA
LINA CHAVARRO GUTIERREZ
Flashcards by LINA CHAVARRO GUTIERREZ, updated more than 1 year ago
LINA CHAVARRO GUTIERREZ
Created by LINA CHAVARRO GUTIERREZ about 7 years ago
11
0

Resource summary

Question Answer
PREPROCESAMIENTO Y CALIDAD DE DATOS Tecnologías como Internet generan datos a un ritmo exponencial gracias abaramiento y gran desarrollo del almacenamiento y los recursos de red. ASPECTOS IMPORTANTES Se caracteriza los datos masivos son la veracidad de los datos y el valor intrínseco del conocimiento extraído.
CARACTERÍSTICAS La veracidad y el valor de los datos y cuyo objetivo es filtrar el ruido y mantener los datos valiosos que pueden ser utilizados para la toma de decisiones inteligentes. PREPROCESAMIENTO DE DATOS Es una etapa esencial del proceso de descubrimiento de información. -Se encarga de la limpieza de datos, su integración, transformación y reducción para la siguiente fase de minería de datos.
LA PREPARACIÓN DE LOS DATOS El sistema prepara las bases de los datos que serán utilizados durante todo el ciclo del proceso en sus diferentes etapas. BIG DATA La necesidad de procesar y extraer conocimiento valioso de tal inmensidad de datos se ha considerado en un desafió considerable para científicos de datos y expertos en la materia.
SPARK es perfecto para procesos iterativos donde un mismo dato es reutilizado varias veces para el procesamiento de algoritmos sobre grafos, etc. ALGORITMOS PREPROCESAMIENTO DE DATOS MASIVOS En esta subseccion mostramos brevemente los algoritmos de preprocesamiento disponibles en las herramientas de analítica de datos previamente descritas.
REDUNDANCIA ACUMULADA Desarrolla una aproximación voraz al problema de calculo de importancia de atributos. REUTILIZACION DE CÁLCULOS PREVIOS Almacena para su reutilizacion algunos datos importantes cuando son calculados por primera vez.
PROCESAMIENTO POR COLUMNAS Normalmente formando una lista de filas son transformados a unas lista de columnas de manera que los cálculos entre atributos se tornan mas sencillos de realizar. CONCLUSIONES Este trabajo se estudia la creciente importancia del preprocesamiento de datos en Big Data. Se presenta una revisión de las tecnologías de Big Data herramientas analíticas de datos y técnicas y algoritmos disponibles para el preprocesamiento de datos masivos.
Show full summary Hide full summary

Similar

Capitulo 6
Pau Eliza
Describe - Practice questions and answers for AS Physics A
nikeishabk
Macbeth cards
gregory.rolfe
unit 1 f321 chemistry ocr
methmip
GCSE Biology heart notes
Kamila Woloszyn
Common Irish Words
silviaod119
Biology
Holly Bamford
Economics - unit 1
Amardeep Kumar
A-Level Law: Theft
amyclare96
Data Types
Jacob Sedore
Forces and Motion Practice Test
Fernanda Silva2990