Aula 10 - Pig

Beschreibung

Hadoop Mindmap am Aula 10 - Pig, erstellt von Ronaldo Pimentel am 14/10/2017.
Ronaldo Pimentel
Mindmap von Ronaldo Pimentel , aktualisiert more than 1 year ago
Ronaldo Pimentel
Erstellt von Ronaldo Pimentel vor fast 7 Jahre
29
1

Zusammenfassung der Ressource

Aula 10 - Pig
  1. MapReduce
    1. Abordagem de baixo nível, em relação ao modelo mapreduce, maior controle e desempenho
      1. Consome mais tempo e mais propenso a erros na fase de implantação. Google informeou que um dev demorava 4h para fazer em mapreduce e 15min em pig
        1. Utilizado quando controle e desempenho sao muito importantes
        2. Motivação
          1. - MapReduce é baixo nível - MapReduce é difícil de manter e reutilizar - Desenvolvedores não estavam confortáveis com MapReduce e linguagem SQL
            1. DEsenvolvedores estavam acostumados ao desenvolvimento anterior orientado a grafos
            2. Necessitavam de uma solucao menos complicada, mas que aceitasse dados nao estruturados
            3. Caracteristicas
              1. Utilizar em grandes volumes. algumas queries demoram até 20 segundos para iniciar.
                1. pode ter desempenho superior ao map reduce puro
                2. Aplicacoes
                  1. Processamentos dados brutos
                    1. ETL
                      1. Pipeline de dados
                        1. Exemplos de dados utilizados: • Tweets • Dados de usuarios • Notificações • Retweets • Seguidores • Uso de SMS • Logs do servidor • Logs de busca • Logs de queries
                          1. Exemplos de análises realizadas com Pig: • Quantidade de requisições diárias • Latência média • Quantidade de pesquisas diárias • Distribuição geográfica • Testes A/B • Descoberta de padrão de comportamento do usuário • Análise de sentimento • Análise de reputação do usuário
                          2. Arquitetura
                            1. Executa jobs map e reduces
                              1. é uma lingugaem de fluxo de dados se precisar de estruturas diversas tem que associar com outras linguagem
                                1. Scripts são convertidos para mapreduce jobs
                                  1. possui funcoes especificas, por exemplo para ordenar pela frequencia. algo que não existe no mapreduce
                                    1. linguagem procedural de script
                                    2. Uso
                                      1. /scripts em linguagem Pig Latin
                                        1. Grunt shell - interativo, faz e testa
                                          1. pode utilizar local sem enviar para o mapreduce
                                          Zusammenfassung anzeigen Zusammenfassung ausblenden

                                          ähnlicher Inhalt

                                          Bigdata - Arquitetura Hadoop
                                          Ronaldo Pimentel
                                          Bigdata - Arquitetura Hadoop
                                          Wagner Oliveira Nascimento
                                          Bigdata - Arquitetura Hadoop
                                          Gustavo Galhardo
                                          Bigdata - Arquitetura Hadoop
                                          Roberta Reis
                                          Bigdata - Arquitetura Hadoop
                                          WALLACE SANTOS GRACA
                                          Französisch Vokabeln Découvertes 1, Leçon 1, Karteikarten
                                          AntonS
                                          The American Dream
                                          barbara91
                                          Vetie - Radiologie Übungs-K
                                          Fioras Hu
                                          Innere Rind Vetie
                                          Anne Käfer
                                          Basiswissen Management Sozialer Dienstleistungen - Dienstleistungscharakteristika
                                          Bernd Leisen
                                          Vetie: Milch 2020 Matrikel 14
                                          Johanna Tr