PREPROCESAMIENTO Y CALIDAD DE DATOS

Descrição

BIG DATA
LINA CHAVARRO GUTIERREZ
FlashCards por LINA CHAVARRO GUTIERREZ, atualizado more than 1 year ago
LINA CHAVARRO GUTIERREZ
Criado por LINA CHAVARRO GUTIERREZ aproximadamente 7 anos atrás
11
0

Resumo de Recurso

Questão Responda
PREPROCESAMIENTO Y CALIDAD DE DATOS Tecnologías como Internet generan datos a un ritmo exponencial gracias abaramiento y gran desarrollo del almacenamiento y los recursos de red. ASPECTOS IMPORTANTES Se caracteriza los datos masivos son la veracidad de los datos y el valor intrínseco del conocimiento extraído.
CARACTERÍSTICAS La veracidad y el valor de los datos y cuyo objetivo es filtrar el ruido y mantener los datos valiosos que pueden ser utilizados para la toma de decisiones inteligentes. PREPROCESAMIENTO DE DATOS Es una etapa esencial del proceso de descubrimiento de información. -Se encarga de la limpieza de datos, su integración, transformación y reducción para la siguiente fase de minería de datos.
LA PREPARACIÓN DE LOS DATOS El sistema prepara las bases de los datos que serán utilizados durante todo el ciclo del proceso en sus diferentes etapas. BIG DATA La necesidad de procesar y extraer conocimiento valioso de tal inmensidad de datos se ha considerado en un desafió considerable para científicos de datos y expertos en la materia.
SPARK es perfecto para procesos iterativos donde un mismo dato es reutilizado varias veces para el procesamiento de algoritmos sobre grafos, etc. ALGORITMOS PREPROCESAMIENTO DE DATOS MASIVOS En esta subseccion mostramos brevemente los algoritmos de preprocesamiento disponibles en las herramientas de analítica de datos previamente descritas.
REDUNDANCIA ACUMULADA Desarrolla una aproximación voraz al problema de calculo de importancia de atributos. REUTILIZACION DE CÁLCULOS PREVIOS Almacena para su reutilizacion algunos datos importantes cuando son calculados por primera vez.
PROCESAMIENTO POR COLUMNAS Normalmente formando una lista de filas son transformados a unas lista de columnas de manera que los cálculos entre atributos se tornan mas sencillos de realizar. CONCLUSIONES Este trabajo se estudia la creciente importancia del preprocesamiento de datos en Big Data. Se presenta una revisión de las tecnologías de Big Data herramientas analíticas de datos y técnicas y algoritmos disponibles para el preprocesamiento de datos masivos.

Semelhante

Capitulo 6
Pau Eliza
Francês
BeatrizL
Introdução à ContabilidadePública
Alynne Saraiva
Estações do Ano
Alessandra S.
Manual de Técnicas de Redação
Alessandra S.
Vocabulário sobre o corpo em Francês
Catarina D.
Phrasal Verbs - Inglês #5
Eduardo .
Expressões em inglês #7
Eduardo .
Tendências pedagógicas: Liberais e progressistas
Thiago Silva
Avaliação de Alunos
Alessandra S.