Spark

Descrição

Big data FlashCards sobre Spark, criado por Primo Deckers em 01-03-2017.
Primo Deckers
FlashCards por Primo Deckers, atualizado more than 1 year ago
Primo Deckers
Criado por Primo Deckers mais de 7 anos atrás
20
1

Resumo de Recurso

Questão Responda
Engine de execução generalista ? Spark
Sua exeção é baseada em Resilient Distributed Datasets? RDD
Outros Frameworks especializam O Spark generaliza
RDDs São coleções particionadas de dados; Criados por operações determinísticas (Transformações) em outro RDD ou arquivo; O usuário define o particionamento (otimizações de localidade) e armazenamento (RAM, disco).
É uma Engine de execução generalista Seu processamento é: Iterativo; em Batch; Streaming(simulado)
O Spark possui? Armazenamento Temporario em Ram ou disco; Leitura e escrita em diversos formatos: CVS; Json; Parquet; Arquivos de texto simples; Leitura escrita de diversas fontes: Arquivos locais; HDFS; S3; JDBC/ODBC;
O Spark possui? Mais de 80 operadores, intercambiaveis com consultas SQL: Map; reduceByKey; Filter; SortByKey; Três APIs principais de uso: RDDs; Datarames; Datasets (experimental)
Linguagens: Scala (principal); Java; Python; R;
O spark é executado em varios ambientes Standalone; Hadoop Yarn (gerenciador de recursos e tarefas do hadoop); Mesos;
Sub-projetos SPARK Spark Streaming (simula operações em tempo real utilizando mini batch); Spark SQL; MLLib (Aprendizado de maquina); GraphX (processamento de grafos com suporte a Pregel)
Comparativo com outros frameworks

Semelhante

Big Data
djalma.melo
BIG DATA
Eduardo Diniz
011 - Conceito - Big Data Analytics
Projetos Casal2004
Fundamentos Químicos da vida
Priscila Reinaldo
REAÇÕES QUÍMICAS
Yani
FUNÇÕES DA CRIMINOLOGIA.
fcmc2
Resumo global da matéria de Biologia e Geologia (10.º e 11.º anos)_2
ana-carolina12re
Períodos da História do Brasil
GoConqr suporte .
Teoria do Crime
Marianna Martins
Certo e Errado - Língua Portuguesa
Sérgio Britto