Spark

Description

Big data Flashcards on Spark, created by Primo Deckers on 01/03/2017.
Primo Deckers
Flashcards by Primo Deckers, updated more than 1 year ago
Primo Deckers
Created by Primo Deckers over 7 years ago
20
1

Resource summary

Question Answer
Engine de execução generalista ? Spark
Sua exeção é baseada em Resilient Distributed Datasets? RDD
Outros Frameworks especializam O Spark generaliza
RDDs São coleções particionadas de dados; Criados por operações determinísticas (Transformações) em outro RDD ou arquivo; O usuário define o particionamento (otimizações de localidade) e armazenamento (RAM, disco).
É uma Engine de execução generalista Seu processamento é: Iterativo; em Batch; Streaming(simulado)
O Spark possui? Armazenamento Temporario em Ram ou disco; Leitura e escrita em diversos formatos: CVS; Json; Parquet; Arquivos de texto simples; Leitura escrita de diversas fontes: Arquivos locais; HDFS; S3; JDBC/ODBC;
O Spark possui? Mais de 80 operadores, intercambiaveis com consultas SQL: Map; reduceByKey; Filter; SortByKey; Três APIs principais de uso: RDDs; Datarames; Datasets (experimental)
Linguagens: Scala (principal); Java; Python; R;
O spark é executado em varios ambientes Standalone; Hadoop Yarn (gerenciador de recursos e tarefas do hadoop); Mesos;
Sub-projetos SPARK Spark Streaming (simula operações em tempo real utilizando mini batch); Spark SQL; MLLib (Aprendizado de maquina); GraphX (processamento de grafos com suporte a Pregel)
Comparativo com outros frameworks
Show full summary Hide full summary

Similar

Big Data
djalma.melo
BIG DATA
Eduardo Diniz
011 - Conceito - Big Data Analytics
Projetos Casal2004
IMPERFECT TENSE - French
T W
AQA GCSE Biology genetic variation
Olivia Phillips
Metallic bonding
anna.a.graysmith
Presentations in English
Alice McClean
IB Chem Flashcards
j. stu
Psychology flashcards memory
eharveyhudl
Edexcel Additional Science Chemistry Topics 1+2
El Smith
Health and Social Care Flashcards
Kelsey Phillips