Conferencista: Fabián García Nocetti, IIMAS-UNAM.
Expone el tema de cómputo de alto rendimiento y su relación con big-data y presenta un estudio de caso.
Autor del mapa: Fernando Jimenez Martinez del grupo 5SB
INGENIERIA EN SISTEMAS COMPUTACIONALES ITSTA
https://www.youtube.com/watch?time_continue=1020&v=8n6lfB6G6mU
COMPUTACIÓN DE ALTO RENDIMIENTO (HPC)
ES EL USO DE PROCESAMIENTO PARALELO PARA EJECUTAR APLICACIONES AVANZADAS DE MANERA
EFICIENTE, CONFIABLE Y RAPIDA.
EL TERMINO SE APLICA EN ESPECIAL A SISTEMAS QUE OPERAN ARRIBA DE UN TERAFLOP.
USUARIOS FRECUENTES:
• INVESTIGADORES
• CIENTIFICOS
• INGENIEROS
• INSTITUCIONES ACADEMICAS
APLICACIONES
LA SIMULACION DE TERREMOTOS PARA
IDENTIFICAR AREAS ESPECIALMENTE
SENSIBLES Y PREDECIR SUS CONDICIONES.
MODELADO DEL CLIMA MODELOS
COMPUTACIONALESPUEDEN SER
USADOS CON DATOS VIEJOS PARA
EVALUAR SU UTILIDAD.
MODELAJE DE PROTOTIPOS. BIG DATA
BENEFICIOS:
EL TIEMPO DE AJUSTE EN UN
LABORATORIO ES DE UNOS 9
MESES, HPC PUEDE REDUCIR A
MENOS DE UNA SEMANA.
EL ANALISIS DE UN COMPONENTE CUESTA EN
PROMEDIO 50,000 USD EN UN LABORATORIO,
MIENTRAS QUE MEDIANTE HPC SE PUEDE HACER POR
3,000 USD.
PROTOTIPOS VIRTUALES Y MODELADOS
EN GRAN ESCALA CON BASE EN HPC
ACELERAN Y RACIONALIZAN LOS
PROCESOS.
SE MEJORA LA INVESTIGACION Y
EL DESARROLLO, EL DISEÑO Y LA
INGENIERIA, ASI COMO TAMBIEN
LOS PROCESOS DE NEGOCIOS
(MINERIA DE DATOS, LOGISTICA,
CRM, ETC).
ECONOMÍA
EL VALOR TOTAL DEL
MERCADO MUNDIAL DE HPC
ERA DE UNOS $26 MIL
MILLONES(2010).
SE ESTIMA QUE ALCANZARA LOS $30 MIL
MILLONES(2015).
NUEVOS MODELOS
DE NEGOCIOS
MEDIANTE INTERNET
Y LA COMPUTACION
EN LA NUBE.
BARRERAS AL USO DEL HPC
BARRERAS EDUCACIONALES Y DE
CAPACIDADES (FALTA DE CIENTÍFICOS
COMPUTACIONALES)
OBSTÁCULOS TÉCNICOS
LOS CÓDIGOS HEREDADOS
DEBEN SER ACTUALIZADOS.
HAY REZAGO EN LA FORMULACIÓN DE
NUEVOS CÓDIGOS.
LAS EMPRESAS VEN AL HPC
COMO UN COSTO NO
COMO UNA INVERSIÓN.
BIG DATA Y ANALYTICS
BIG DATA CONJUNTO DE DATOS CUYO TAMAÑO ESTÁ MAS
ALLA DE LA CAPACIDAD DE HERRAMIENTAS DE
SOFTWARE DE BASE DE DATOS TIPICAS PARA CAPTURAR,
ALMACENAR, GESTIONAR Y ANALIZAR LA INFORMACION.
SE ORIGINA POR LA EXPLOSION EN LA CANTIDAD Y
DIVERSIDAD DE DATOS DIGITALES GENERADOS EN
TIEMPO REAL COMO RESULTADO DEL ROL CADA
VEZ MAYOR DE LA TECNOLOGIA EN LAS
ACTIVIDADES DIARIAS.
SIRVE PARA GENERAR INFORMACION Y
CONOCIMINETO CON BASE EN INFORMACION
COMPLETA EN TIEMPO REAL.
ANALYTICS SE
ORIGINA EN EL AREA
DE BIOLOGIA
HERRAMIENTAS Y
METODOLOGIAS PARA
TRANSFORMAR
CANTIDADES MASIVAS
DE DATOS
PROBLEMAS DISPONIBILIDAD DE DATOS
FALTA DE INCENTIVOS PARA COMPARTIR
DATOS
LOS DATOS SON UN NUEVO FACTOR DE
PRODUCCIÓN Y DE VENTAJA
COMPETITIVA.
OPORTUNIDAD: APRENDER
SOBRE EL COMPORTAMIENTO
HUMANO PARA DIVERSOS
FINES.
CREACION DE VALOR VIA INNOVACIÓN,
EFICIENCIA Y COMPETITIVIDAD.
NUEVAS FORMAS DE COMPETENCIA
Y NUEVOS NEGOCIOS.
ANALISIS DE DATOS
EMPRESARIALES. EN 2010 SE
ESTIMABA EL VALOR DE ESTA
INDUSTRIA EN MAS DE $100
MIL MILLONES, CRECIENDO A
CASI UN 10% AL AÑO.
BIG DATA PARA LA CREACION DE VALOR
SEGEMENTACION DE MERCADO Y
POBLACION PARA PERSONALIZAR
ACCIONES.
INNOVACION EN NUEVOS MODELOS DE
NEGOCIOS, PRODUCTOS Y SERVICIOS MEJORA
DE PRODUCTOS EXISTENTES.
NUEVOS MODELOS DE SERVICIO A NIVEL
EMPRESARIAL Y GUBERNAMENTAL.
ANALYTICS: CAPACIDADES
LA ANALITICA DE GRANDES DATOS SE REFIERE A LAS
HERRAMIENTAS Y METODOLOGIAS PARA
TRANSFORMAR CANTIDADES MASIVAS DE DATOS
BRUTOS EN “DATOS SOBRE DATOS” CON PROPOSITOS
ANALITICOS.
DATA SCIENCE
TECNICAS NECESARIAS PARA MANIPULAR
Y TRATAR LA INFORMACION DESDE UN
PUNTO DE VISTA
ESTADISITICO/MATEMATICO.
IMPLICA HALLAR CORRELACIONES, APLICAR
ALGORITMOS MAS COMPLEJOS Y
PROPORCIONAR NIVELES DE VISIBILIDAD QUE
TRANSFORMAN EL CONTACTO DE UNA
ENTIDAD CON SU ENTORNO.
S/W PARA BIG DATA
HADOOP BUCA RESOLVER PARTE DE LOS
PROBLEMAS ASOCIADOS A BIG DATA Y A LA
APARICION DEL DATA SCIENCE.
UTLIZA MAP REDUCE(DISTRIBUCION Y PARALELIZACION,
TOLERANCIA A FALLAS Y REDUNDANCIAS , TRANSPARENCIA, ) Y
HDFS.
FASES DE BIGDATA Y SUS SOLUCIONES CON HADOOP
1.- DESCUBRIMIENTO DE GRANDES DATOS.
2.- EXTRACCION Y LIMPIEZA DE LOS GRANDES VOLUMENES DE DATOS.