Apache Hadoop

Descrição

Noveno Cloud Computing Mapa Mental sobre Apache Hadoop, criado por JAMESON SLEYDER TIERRADENTRO GARZON em 31-08-2022.
JAMESON SLEYDER TIERRADENTRO GARZON
Mapa Mental por JAMESON SLEYDER TIERRADENTRO GARZON, atualizado more than 1 year ago
JAMESON SLEYDER TIERRADENTRO GARZON
Criado por JAMESON SLEYDER TIERRADENTRO GARZON aproximadamente 2 anos atrás
30
0

Resumo de Recurso

Apache Hadoop
  1. Framework de código abierto
    1. Procesa gran volumen de datos distribuidos
    2. Arquitectura
      1. NameNode (master)
        1. Controla el acceso de clientes a la información
          1. Secundary NameNode
            1. Copia el namespace, en caso de reinicio de sistema a causa de fallos en el NameNode
          2. DataNodes
            1. Almacenamiento de bloques de datos
              1. Entregar información
                1. Reporte de metadatos
                2. HDFS
                  1. Utiliza múltiples computadoras genéricas en clústers
                  2. JobTracker
                    1. Crea tareas MapReduce
                      1. Comprobar tareas fallidas
                        1. Puede re-programar en caso de fallos
                        2. TraskTracker
                          1. Corre MapReduce
                            1. Paralelizar procesos en dos fases
                              1. Mapeo: Escaner de datos y generar listas clave-valor
                                1. Reduce: Procesa y genera resultados
                          2. Modos de funcionamiento
                            1. Local pseudo-distribuido
                              1. Nodo único en un solo proceso Java
                              2. Local
                                1. Nodo único pero en procesos Java diferente
                                2. Distribuido
                                  1. Múltiples nodos distribuidos
                                3. Entorno
                                  1. Únicamente en entorno Linux y tener instalado Java
                                  2. Instalación
                                    1. Descargar desde la Web Oficial
                                      1. Crear usuario para administrar Hadoop
                                        1. Logeo y agragar variables de entorno
                                          1. Ejecutar 'source.bashrd'
                                      2. Configurar SSH
                                        1. Configurar el protocolo
                                          1. $ sudo apt-get install ssh | $ ssh-keygen -t rsa -f ~/.ssh/id_rsa | $ cat ~/.ssh/id_rsa.pub >> ~/.ssh/authorized_keys
                                            1. Otorgar permisos
                                              1. Comprobar conexión
                                                1. $ ssh localhost
                                                  1. Desactivar protocolo IPv6
                                                    1. $ net.ipv6.conf.all.disable_ipv6 = 1 $ net.ipv6.conf.default.disable_ipv6 = 1 $ net.ipv6.conf.lo.disable_ipv6 = 1
                                                  2. $ sudo chmod go-w $HOME $HOME/.ssh $ sudo chmod 600 $HOME/.ssh/authorized_keys $ sudo chown `whoami` $HOME/.ssh/authorized_keys
                                                2. Configurar HDFS
                                                  1. ‘/usr/local/hadoop/etc/hadoop’
                                                    1. core-site.xml
                                                      1. Configurar el directorio HDFS por defecto en el localhost
                                                      2. hdfs-site.xml
                                                        1. Informa como Hadoop almacenará la información
                                                        2. mapred-site.xml
                                                          1. Especifica quien realiza el MapReduce y donde se lleva a cabo
                                                          2. yarn-site.xml
                                                            1. Configurar el YARN

                                                    Anexos de mídia

                                                    Semelhante

                                                    CLOUD COMPUTING
                                                    carolinesca86
                                                    CLOUD COMPUTING
                                                    Cynthia Eduarte
                                                    Cloud Computing
                                                    proyectoFinla 43GRU
                                                    Aprendizaje y enseñanza de los contenidos escolares 1: Datos y Conceptos
                                                    maya velasquez
                                                    TECNICAS DE RECOLECCION DE DATOS
                                                    Francisco Gómez
                                                    DIAPOSITIVAS DEFINITIVAS
                                                    galle1221j
                                                    Grafos
                                                    hor_dan
                                                    Características y Perspectivas de la Web 3.0
                                                    Paúl Baldeón
                                                    IDENTIFICACIÓN DE PROCESOS PARA EL MANEJO DE DATOS
                                                    sephirothblackfi
                                                    Periodismo de datos
                                                    luisguet
                                                    Bases de Datos
                                                    marcos100299