Zusammenfassung der Ressource
Estatística I
- Conceitos
Gerais
Anmerkungen:
- Estatística depende de:
Interpretação
Escolhas
Avaliação.
Não traz resultados exatos
- Definição
Anmerkungen:
- Estatística é ciencia que utiliza de teorias para estudar frequencia de eventos.
- Divisões
- Descritiva
Anmerkungen:
- Faz um resumo dos dados já registrados para análise.
- Probabilística
Anmerkungen:
- Procura estudar eventos do acaso
- Inferencial
Anmerkungen:
- Procura respostas através de análise de amostras e suas variabilidades.
- Métodos de estudo
Anmerkungen:
- Observação: Pesquisa dos registros
Experimento: Análise de causa e efeito.
- Variáveis (Tipos)
- Quantitativas
- Contínuas
Anmerkungen:
- Números reais
Ex: Peso, altura, temperatura, etc
- Discretas
Anmerkungen:
- Números fixos inteiros.
Ex: Nº de voltas de uma corrida; Idade de uma pessoa; quantidade de laranjas
- Qualitativas
- Categóricas
Anmerkungen:
- Ordinais: Tem hierarquia
Nominais: Não tem
- EDA
Anmerkungen:
- Objetivo: Obter informações ocultas afim de buscar uma solução
Obs: Não é análise somente com gráficos
- Amostragem
Anmerkungen:
- É parte da população (subconjunto);
É possível inferir sobre...se não é enviesada.
Custos: Margem erro, variação.
Podemos medir variação;
- Tipos Amostra
- Aleatória Simples
Anmerkungen:
- Escolher elementos aleatórios;
Todos tem mesma chance (indexar e selecionar;
Com ou sem reposição.
- Estratificada
Anmerkungen:
- Estratos
Ex: raça, religião,etc...
- Sistemática
Anmerkungen:
- Escolhe um elemento aleatório e conta n números para selecionar o próximo.
- Medidas de Centralidade e
Variabilidade
- Centralidade
Anmerkungen:
- Média é influenciável pelos outliers, enquanto que mediana não.
- Média
Anmerkungen:
- soma todos elementos e divide pela quantidade dos elementos;
Tem Média Ponderada (peso para cada elemento);
- Mediana
Anmerkungen:
- Valor bem ao meio de todos elementos em ordem crescente;
Se par: média n/2 e n/2+1
Se ímpar: posição (n+1)/2
- Moda
Anmerkungen:
- Elemento (valor) que tem maior frequencia na amostra
- Variabilidade
Anmerkungen:
- A Variância é influenciada por outliers (valores discrepantes), logo precisa analisá-los
- Variância
Anmerkungen:
- Regularidade dos dados entre si(média). Mostrar a variação dos dados;
- Desvio Padrão
Anmerkungen:
- Dispersão dos dados sobre a média;
Quanto maior, mais longe da média;
Cálculo: Raiz quadrada da variancia
- Amplitude
Anmerkungen:
- Diferença entre elementos maior e menor
- Quartis
Anmerkungen:
- Q1 = 25% menores valores
Q2 = Mediana
Q3 = 75% maiores valores
Q0 = menor valor
Q4 = maior valor
- Probabilidade
Anmerkungen:
- Chance de um evento acontecer;
Mede entre 0 e 1;
Experimento (Ex: jogar moeda)
Espaço amostral (Ex: cara ou coroa)
Evento: "deu" coroa.
- Formas de analisar Eventos
Anmerkungen:
- Pequenas amostras podem trazer conclusões falsas
- Único
- Excludentes
Anmerkungen:
- Não excludentes
Anmerkungen:
- soma as frações e exclui soreposições
- Dependentes
Anmerkungen:
- Multiplica frações, porém na segunda tira um denominador
- Independentes
Anmerkungen:
- Multiplica as frações, porém sem tirar o segundo denominador
- Passeio Aleatório
Anmerkungen:
- Sucessão etapas independentes;
Ex: ações/investimentos (é um passeio porém há padrões e tendencias)
- Estocástico vs. Determinístico
Anmerkungen:
- Se um conjunto de amostras passa por algoritimo varias vezes e da mesmo resultado é Determinístico (Ex: algoritimo Hash)
Se um conjunto de amostras passa por algoritimo varias vezes e da resultados diferentes é Estocástico (Ex: Random Forest)
- Distribuição
Anmerkungen:
- Estuda comportamento dos dados aletatórios;
Como? histograma, qqplot ou teste shapiro wilk (p-value comparado com alpha);
Distribuições simétricas e assimétricas
- Distribuição Normal
Anmerkungen:
- Só ocorre com concentração de dados simétrica.
- Dist. Norm. Padrão
Anmerkungen:
- Utilizado para calcular probabilidade;
Cálculo = Z = objeto - média / desvio padrão. O resultado compara na tabela;
Obs: quando Z é a direita, precisa subtrair por 1;
Obs2: Quando resultado for 2 casas decimais, muda consulta na tabela;
- Teorema Central do limte
Anmerkungen:
- Conforme número da amostragem aumenta, a distribuição se aproxima do normal