Zusammenfassung der Ressource
Estatística
- Amostragem
- Inferência
estatística
- Estimação
de
parâmetro
- Por ponto
Anmerkungen:
- Na
estimação por ponto, a estimativa do parâmetro populacional corresponde a
um único valor estimado.
- Estimação desvio-padrão
Anmerkungen:
- Embora S
2
, conforme definido em (11), seja um estimador justo da variância
populacional σ
2
, sua raiz quadrada S não é um estimador justo do desvio
padrão populacional σσσ
- Por intervalo
Anmerkungen:
- Na segunda técnica, constrói-se um intervalo, o qual
deverá, com probabilidade conhecida, conter o parâmetro. Neste curso
admitiremos, salvo menção em contrário, que a amostragem sempre será
aleatória.
- Intervalo de confiança
Anmerkungen:
- A quantidade aleatória é o intervalo [L, U]; o parâmetro θθθ
não é considerado aleatório, pois é um valor fixo.
- Estimador
e estimativa
Anmerkungen:
- Um estimador(ou estatística) é qualquer função das observações de
uma amostra, que será usado no processo de estimação do parâmetro
populacional desejado.
Chamamos de
estimativa um particular valor assumido por um estimador
- Propriedades
- Justo
Anmerkungen:
- Um estimador Θˆ
é justo(ou não viesado, ou não viciado, ou
não tendencioso) se o seu valor esperado (ou média) for igual ao valor do
parâmetro θque se pretende estimar, isto é, se
(1) .
ˆ
) ( θ Θ= E
Um estimador não viesado é aquele que, na média, acerta o valor
correto do parâmetro populacional.
- Eficiência
- Acurácia
(individual)
Anmerkungen:
- A acuráciade um estimador mede a proximidade de cada
observação do valor alvo que se procura atingir
- Precisão
(com a
média)
Anmerkungen:
- A precisãode um
estimador mede a proximidade de cada observação da média de todas
as observações.
- Eficiente
(ENTVM)
Anmerkungen:
- Um estimador é dito EFICIENTE ou Estimador Não
Tendencioso de Variância Mínima(ENTVM) (*), se
• for não viesado;
• entre os estimadores não viesados, apresentar a menor variância
- Comparação (EQM)
Anmerkungen:
- Define-se o EQMcomo a média da diferença quadrática (diferença ao
quadrado)entre o estimador e o valor do parâmetro
EQM = Variância + Viés²
EQM de Estimador Não Viesado = Variância
- MELVN
Anmerkungen:
- Uma terceira propriedade desejável de um estimador é que ele seja
o Melhor Estimador Linear Não Viesado(MELNV). Para tal, o estimador
tem que:
• ser não viesado;
• ser linear; e
• entre os estimadores lineares e não viesados, apresentar a menor
variância.
- Consistência
Anmerkungen:
- Um estimador é consistente, se, à medida que a amostra cresce,
converge para o verdadeiro valor do parâmetro. Ou seja, quando o
tamanho da amostra vai aumentando, o viés (se existir) vai diminuindo e a
variância também. Um estimador consistente é aquele que converge para o
valor do parâmetro quando o tamanho da amostra tende a infinito.
Se o estimador for justo, a condição de consistência equivale a dizer que sua
variância tende a zero quando o tamanho da amostra tende a infinito
- Máxima
Verossimilhança
- Propriedades:
Anmerkungen:
- Sendo assim, (i) e (ii) estabelecem que o estimador de máxima
verossimilhança é aproximadamente um ENTVM. Esse é um resultado
desejável. Além disso, ele é razoavelmente fácil de se obter em muitas
situações e possui distribuição assintótica normal. Isso explica porque o
método de máxima verossimilhança é largamente utilizado na prática. Para
usar a estimação de máxima verossimilhança, observe que a distribuição da
população deve ser conhecida (ou suposta).
- 1. Consistência;
- 2. Distribuição
assintótica (*) normal.
- Testes de
hipóteses
- Probabilística
Anmerkungen:
- A amostragem será probabilística (ou aleatória ou casual) se todos os
elementos da população tiverem probabilidade conhecida e diferente de zero
de pertencer à amostra. A sua importância decorre do fato de que apenas os
resultados provenientes de uma amostra probabilística podem ser
generalizados estatisticamente para a população da pesquisa.
A obtenção de uma amostra probabilística exige que se obtenha uma listagem
com os elementos da população. Ou seja, exige que a população acessível seja
igual à população alvo. Nem sempre é possível obter tal listagem na prática, o
que teoricamente inviabilizaria a retirada de uma amostra aleatória. Então
deve-se recorrer à amostragem não probabilística.
- Não probabilística.
- Conveniência(acidental)
Anmerkungen:
- porConveniência(acidental): o pesquisador seleciona membros da
população mais acessíveis;
- Intencional(Julgamento)
- Cotas (proporcional)
Anmerkungen:
- por Cotas(proporcional): o pesquisador entrevista um número pré-definido de pessoas em cada uma das várias categorias.
- Vício de amostragem
Anmerkungen:
- Uma amostra não representativa é uma amostra viciadae o vício inerente aos
dados dessa amostra é o vício de amostragem.
- Tipos
- 1 Amostragem
Aleatória Simples
Anmerkungen:
- A AAS é equivalente a um sorteio lotérico. Nela, todos os
elementos da população têm igual probabilidade de pertencer à amostra, e
todas as possíveis amostras têm também igual probabilidade de ocorrer
- Ex.: Sorteio lotérico
- 2 Amostragem
Estratificada
Anmerkungen:
- A Amostragem Estratificada (AE)é usada quando a população pode ser
dividida em sub-populações ou estratos razoavelmente homogêneos (ex.:
departamento, local, idade, tipo de indústria etc.), de forma que cada
elemento da população pertença a um e somente um estrato. Depois que os
estratos são formados, extrai-se uma amostra aleatória simples de cada um
deles. Os melhores resultados são obtidos quando os elementos contidos em
cada estrato são o mais similares possível. Há fórmulas disponíveis para se
combinar os resultados das amostras de estrato individuais em uma estimativa
do parâmetro populacional de interesse. Se os estratos forem homogêneos, o
procedimento de amostragem estratificada produzirá resultados tão precisos
quanto os da amostragem aleatória simples, mas utilizando um tamanho total
de amostra menor.
Por exemplo, considere que a população de uma universidade tenha a seguinte
composição: 10% de professores, 15% de funcionários e 75% de alunos.
Então uma amostra estratificada proporcional teria 10% de professores, 15%
de funcionários e 75% de alunos.
- Divisão em
subpopulações
semelhantes
- 3 Amostragem por
Conglomerados
Anmerkungen:
- 1.1.3 Amostragem por Conglomerados
Na Amostragem por Conglomerados (AC), a população é dividida em
subpopulações (conglomerados) distintas (quarteirões, residências, famílias,
bairros, etc.). Cada elemento da população pertence a um e somente a um
conglomerado. Algunsdos conglomerados são selecionados segundo a AAS e
todosos indivíduos nos conglomerados selecionados são observados. Ou seja,
as unidades de amostragem, sobre as quais é feito o sorteio, passam a ser os
conglomerados e não mais os elementos individuais da população.
A AC tende a produzir os melhores resultados quando os elementos neles
contidos não são similares. No caso ideal, cada conglomerado é uma versão
representativa em pequena escala da população inteira. O valor da AC
depende de quão representativo é cada conglomerado da população inteira. Se
todos os conglomerados forem similares nesse aspecto, a amostragem de um
pequeno número de conglomerados produzirá boas estimativas dos
parâmetros populacionais.
- Divisão em
bairros.
Selecionar
número
suficiente de
conglomerados
de forma que
constituam uma
amostra
- 4 Amostragem
Sistemática – AS
Anmerkungen:
- 1.1.4 Amostragem Sistemática – AS
Os elementos da população apresentam-se ordenados e são retirados
periodicamente (de cada k elementos, um é escolhido).
Ocorre, por exemplo, no caso da aplicação experimental de uma nova droga
em pacientes, quando a ética obriga que haja concordância dos escolhidos.
- Elementos
ordenados
escolhidos
de forma
sistemática
- Teorema Central do Limite
Anmerkungen:
- TCL:a soma de um grande número de variáveis aleatórias independentes tem
uma distribuição que é aproximadamente normal.
- Introduzir texto aqui
- Distribuições Amostrais
- Distribuição
Amostral da
Média
Anmerkungen:
- Vemos, portanto, que a média em torno da qual devem variar os
possíveis valores da estatística X é a própria média da população.
Além disso, a variância com que se dispersam os possíveis valores da
estatística X é nvezes menor do que a variância da populaçãode onde
é retirada a amostra.
- E(X_) = mi
- Var(X_) = (Sigma^2)/n
- DP(X_) = sigma/raiz(n)
- É normal quase
sempre, até em
casos de médias
de distribuições
não normais
- Distribuição
Amostral de
uma
Proporção
- E(p^)=p
- Var(p^) =p*(1-p)/n
- Distribuição
Amostral de
S 2
- E (qui2) = n
- Var (qui2) =2n
- Aditividade:
Anmerkungen:
- Propriedade (aditividade).A soma de duas variáveis independentes
2
1 ν
χ e
2
2 ν
χ é uma variável
2
21 νν +
χ , ou seja, é uma variável
2
χ com ν 1+ν2
graus de
liberdade.
- Distribuição
t de
Student
- Distribuição
F de
Snedecor
- n-1
Anmerkungen:
- Considere, por exemplo, a estatística nXXXX n
/)... (
21 +++= . Ela possui n
graus de liberdadeporque nvalores Xi
livres devem ser considerados no
cálculo da estatística. Por outro lado, a estatística
2
S , por usar X em vez do
parâmetro populacional µ, tem um grau de liberdade a menos. Note que o
cálculo de
2
S admite que já se conheça o valor de X , para o qual já foram
usados todos os valores da amostra. Contudo, quando usamos novamente
todos os valores da amostra para determinar
2
S , esses valores têm apenas n–
1 graus de liberdade, pois, dados quaisquer n–1 deles, o valor restante estará
determinado, pois já sabemos o valor da média X ; assim, o valor restante não
é livre.
- Lei dos Grandes Números
- Lei Forte
Anmerkungen:
- Lei Forte dos Grandes Números:a média de uma sequência de variáveis
aleatórias independentes com mesma distribuição converge, com probabilidade
1, para a média daquela distribuição.
- Lei Fraca
Anmerkungen:
- É Provável
A lei fraca dos grandes números diz que, para qualquer valor n
grande específico, é provável que a média nxxx n
/)...(
21 +++ esteja próxima de µ.
- Variância
- Soma
Anmerkungen:
- variância da soma de variáveis independentes é igual à soma das
variâncias individuais.