Zusammenfassung der Ressource
BIG DATA
- Tipos de Datos
- Smart Data
- Datos referente al
negocio, actividades
on-line, ventas, entre
otros
- Identity Data
- Datos que
identifican a las
personas
- Open Data
- Data pública de
las empresas
- Los proyectos deben
cumplir con el modelo
de las 4 V
- Volumen: gran volumen
de datos, más de un millón
de registros
- Velocidad: Respuestas a
consultas en un tiempo
menor a 5 seg
- Variedad: Los
datos a manejar
tienen estructura
variable
- Veracidad: Respuestas
efectivas - iguales siempre
en cada respuesta-
- Los datos son variados,
escalables, se necesita con
velocidad, no estructurados
- Lo más importante es el sistema
de archivos Distribuido hadoop y
el algoritmo map Reduce
- Un Proyecto Exitoso debe
seguir una metodología
planificada
- Bases de Datos
clave - valor
NoSQL
- Cassandra - transaccional
- Mongodb - Documentos
- Neo4j - mapa, grafo
- Grandes Volumenes de datos de
Variedad de Fuentes, se pueden
medir en Petabyte, Exabyte,
Zettabyte, Yottabyte
- Áreas de Aplicación
- Web y social media
- información que es obtenida de los
medios sociales ( Facebook, twitter,
tumbler, etc) y contenido web
- Biometría
- Datos anatómicos, características físicas de una
persona incluyendo huellas digitales, iris, ADN, voz, etc.
- Machine to Machine
- El Internet de las cosas: sensores o medidores
que capturan algún evento en particular
- Big Transaction Data
- Registros de facturación, en telecomunicaciones
registros detallados de las llamadas (CDR), etc.
- Lenguaje NoSQL
(No Only SQL) para
manipular la data
- Tanto el modelo relacional como el
no estructurado pueden escribir en el
sistema de archivos HadoopFS