É uma disciplina das ciências formais
(despidas de objetos, trata apenas da
estrutura conceitual, lógica e
epistemológica do conhecimento) à qual
diferentes ciências empíricas (com objeto
definido) recorrem para melhor conhecer
as coisas de seu interesse. (Pereira.
JCR., 2010)
DESCRITIVA
Envolve a organização, resumo e
representação dos dados. As
ferramentas utilizadas para isso são as
bem conhecidas tabelas de frequência;
gráficos; cálculo de medidas de
tendência central como média, mediana e
moda; e cálculo de medidas de variação
como variância e desvio padrão.
INFERENCIAL
Busca sempre utilizar as
informações de uma
amostra para chegar a
conclusões sobre um
grupo maior, ao qual não
temos acesso. Nesse
sentido, uma ferramenta
muito utilizada na
estatística inferencial é a
probabilidade.
BIO
Busca apenas dar-lhe
o sentido de aplicada
às ciências biológicas
e da saúde. (Pereira.
JCR., 2010)
OBJETO - CARACTERÍSTICA - RELAÇÃO
OBSERVAÇÃO
POPULAÇÃO
É um conjunto de pessoas,
itens ou eventos sobre os
quais você quer fazer
inferências. Nem sempre é
conveniente ou possível
examinar todos os membros
de uma população inteira.
AMOSTRA
É um subconjunto de pessoas, itens
ou eventos de uma população maior
que você coleta e analisa para fazer
inferências. Para representar a
população bem, uma amostra deve
ser coletada aleatoriamente e ser
adequadamente grande. (ver ANEXO
I para definição de técnicas de
amostragem.)
COLETA DE DADOS
VARIÁVEIS
QUALITATIVAS
NOMINAIS
Não existe ordenação
dentre as categorias.
Exemplos: sexo, cor dos
olhos, fumante/não
fumante, doente/sadio.
ORDINAIS
Existe uma ordenação entre as categorias.
Exemplos: escolaridade (1º, 2º, 3º graus),
estágio da doença (inicial, intermediário,
terminal), mês de observação (janeiro,
fevereiro,…, dezembro).
QUANTITATIVAS
DISCRETAS
É avaliada em números que são
resultados de contagens e, por
isso, somente fazem sentido
números inteiros. Exemplos:
número de filhos, número de
bactérias por litro de leite,
número de cigarros fumados
por dia.
CONTÍNUAS
É avaliada em números que são
resultados de medições e, por isso,
podem assumir valores com casas
decimais e devem ser medidas por meio
de algum instrumento. Exemplos: massa
(balança), altura (régua), tempo (relógio),
pressão arterial, idade.
Variável é a
característica de
interesse que é medida
em cada elemento da
amostra ou população.
Como o nome diz, seus
valores variam de
elemento para
elemento. As variáveis
podem ter valores
numéricos ou não
numéricos.
ANÁLISE
MEDIDAS DE
TENDÊNCIA
CENTRAL (MTC)
MÉDIA
X = SOMA(DADOS) /
TAMANHO DA AMOSTRA
É a mais usada para descrever
resumidamente uma distribuição
de frequência. Há vários tipos de
médias a mais utilizada é a média
aritmética.
MODA
AMODAL
Não apresenta
valores repetidos na
amostra ou populção
MODAL
Apresenta valores
repetidos na amostra
ou população
BIMODAL
Apresenta DUAS
repetições de dados
diferentes
MEDIANA
É o valor central em
uma distribuição,
quando o conjunto de
dados está ordenado.
PARA N PAR
Md =((tamanho da amostra / 2) + ([tamanho da amostra / 2] + 1)) /
2
PARA N IMPAR
Md = (tamanho da amostra + 1) /
2
RELAÇÃO ENTRE AS MTC
MÉDIA = MEDIANA = MODA
A) DISTRIBUIÇÃO
SIMÉTRICA
MÉDIA > MEDIANA > MODA
C) DISTRIBUIÇÃO
ASSIMÉTRICA
POSITIVA
MÉDIA < MEDIANA < MODA
D) DISTRIBUIÇÃO
ASSIMÉTRICA
NEGATIVA
MEDIAS DE
DISPERSÃO
São utilizadas para
indicar o grau de
variação dos elementos
de um conjunto
numérico em relação à
sua média.
VARIÂNCIA
Indica o quão distante está cada
valor dos números do valor central.
Dito isso, quanto menor a
variância, mais próximos os valores
da média; quanto maior a variância,
mais distantes os valores estão
da média.
σ² = (dado 1 - média) + (dado 2 - média) /
tamanho da POP
DESVIO
PADRÃO
AMOSTRA
S = RAIZ(S² [VARIÂNCIA AMOSTRAL])
POPULAÇÃO
σ = RAIZ(σ² [ VARIÂNCIA POPULACIONAL])
É uma medida que expressa o
grau de dispersão de um
conjunto de dados. Ou seja, o
desvio padrão indica o quanto um
conjunto de dados é uniforme.
Quanto mais próximo de 0 for o
desvio padrão, mais homogêneo
são os dados.
AMPLITUDE
Tal medida é aplicada em casos
de comparação primária. Ela
equivale a diferença entre o maior
número e o menor número de um
conjunto, ou seja, encontrar a
amplitude basta subtrair o menor
valor do maior valor.
A = MAIOR VALOR - MENOR VALOR
COEFICIENTE DE
VARIAÇÃO DE
PEARSON
É empregada para estimar
a precisão de experimentos
e representa o desvio
padrão expresso como
porcentagem da média. Sua
principal qualidade é a
capacidade de comparação
de distribuições diferentes.
CV = (DESVIO PADRÃO / MÉDIA) * 100
Se CV < 15% : tem-se baixa dispersão
Se 15% CV < 30%: tem-se média
dispersão. Se CV = 30% : tem-se
elevada dispersão