PREPROCESAMIENTO Y CALIDAD DE DATOS

Beschreibung

BIG DATA
LINA CHAVARRO GUTIERREZ
Karteikarten von LINA CHAVARRO GUTIERREZ, aktualisiert more than 1 year ago
LINA CHAVARRO GUTIERREZ
Erstellt von LINA CHAVARRO GUTIERREZ vor fast 7 Jahre
9
0

Zusammenfassung der Ressource

Frage Antworten
PREPROCESAMIENTO Y CALIDAD DE DATOS Tecnologías como Internet generan datos a un ritmo exponencial gracias abaramiento y gran desarrollo del almacenamiento y los recursos de red. ASPECTOS IMPORTANTES Se caracteriza los datos masivos son la veracidad de los datos y el valor intrínseco del conocimiento extraído.
CARACTERÍSTICAS La veracidad y el valor de los datos y cuyo objetivo es filtrar el ruido y mantener los datos valiosos que pueden ser utilizados para la toma de decisiones inteligentes. PREPROCESAMIENTO DE DATOS Es una etapa esencial del proceso de descubrimiento de información. -Se encarga de la limpieza de datos, su integración, transformación y reducción para la siguiente fase de minería de datos.
LA PREPARACIÓN DE LOS DATOS El sistema prepara las bases de los datos que serán utilizados durante todo el ciclo del proceso en sus diferentes etapas. BIG DATA La necesidad de procesar y extraer conocimiento valioso de tal inmensidad de datos se ha considerado en un desafió considerable para científicos de datos y expertos en la materia.
SPARK es perfecto para procesos iterativos donde un mismo dato es reutilizado varias veces para el procesamiento de algoritmos sobre grafos, etc. ALGORITMOS PREPROCESAMIENTO DE DATOS MASIVOS En esta subseccion mostramos brevemente los algoritmos de preprocesamiento disponibles en las herramientas de analítica de datos previamente descritas.
REDUNDANCIA ACUMULADA Desarrolla una aproximación voraz al problema de calculo de importancia de atributos. REUTILIZACION DE CÁLCULOS PREVIOS Almacena para su reutilizacion algunos datos importantes cuando son calculados por primera vez.
PROCESAMIENTO POR COLUMNAS Normalmente formando una lista de filas son transformados a unas lista de columnas de manera que los cálculos entre atributos se tornan mas sencillos de realizar. CONCLUSIONES Este trabajo se estudia la creciente importancia del preprocesamiento de datos en Big Data. Se presenta una revisión de las tecnologías de Big Data herramientas analíticas de datos y técnicas y algoritmos disponibles para el preprocesamiento de datos masivos.
Zusammenfassung anzeigen Zusammenfassung ausblenden

ähnlicher Inhalt

Capitulo 6
Pau Eliza
ein kleines Informatik Quiz
AntonS
Latein Grundwortschatz Vokabeln
anna.grillborzer0656
Globalization – global challenges
ExamTime Bewerter
Tiefergreifendes Lernen - Wie umsetzen?
Laura Overhoff
If Sätze Übungen
Tomasz R
Wagenkunde
malimi something
Klinische Psychologie Teil 2
Lisa Mariá Hchil
13. Altklausuren - Allgemeinwissen Makro
Rafael Mentges
Vetie AVO 2016
Schmolli Schmoll
MS-1.3 Folienpaket 3
Lukas Imwalle