Spark

Description

Big data Flashcards on Spark, created by Primo Deckers on 01/03/2017.
Primo Deckers
Flashcards by Primo Deckers, updated more than 1 year ago
Primo Deckers
Created by Primo Deckers over 7 years ago
20
1

Resource summary

Question Answer
Engine de execução generalista ? Spark
Sua exeção é baseada em Resilient Distributed Datasets? RDD
Outros Frameworks especializam O Spark generaliza
RDDs São coleções particionadas de dados; Criados por operações determinísticas (Transformações) em outro RDD ou arquivo; O usuário define o particionamento (otimizações de localidade) e armazenamento (RAM, disco).
É uma Engine de execução generalista Seu processamento é: Iterativo; em Batch; Streaming(simulado)
O Spark possui? Armazenamento Temporario em Ram ou disco; Leitura e escrita em diversos formatos: CVS; Json; Parquet; Arquivos de texto simples; Leitura escrita de diversas fontes: Arquivos locais; HDFS; S3; JDBC/ODBC;
O Spark possui? Mais de 80 operadores, intercambiaveis com consultas SQL: Map; reduceByKey; Filter; SortByKey; Três APIs principais de uso: RDDs; Datarames; Datasets (experimental)
Linguagens: Scala (principal); Java; Python; R;
O spark é executado em varios ambientes Standalone; Hadoop Yarn (gerenciador de recursos e tarefas do hadoop); Mesos;
Sub-projetos SPARK Spark Streaming (simula operações em tempo real utilizando mini batch); Spark SQL; MLLib (Aprendizado de maquina); GraphX (processamento de grafos com suporte a Pregel)
Comparativo com outros frameworks
Show full summary Hide full summary

Similar

Big Data
djalma.melo
BIG DATA
Eduardo Diniz
011 - Conceito - Big Data Analytics
Projetos Casal2004
How to Create A Mindmap
PatrickNoonan
10 Basic English Questions - Quiz 1
Leo JC
The Cold War
dottydiva96
GoConqr Quick Guide to Getting Started
Andrea Leyden
Forms of Business Ownership Quiz
Noah Swanson
Acids and Bases
Sarah Egan
Using GoConqr to study Maths
Sarah Egan
Cuadro sinóptico de la función de la planeación
Elliot Anderson