CONJUNTO DE METODOS
ESTADISTICOS QUE PERMITEN
INFERIR COMO SE DISTRIBUYE
LA POBLACION EN ESTUDIO O
LAS RELACIONES
ESTOCADISTICAS ENTRE VARIAS
VARIABLES DE INTERES APARTIR
DE LA INFORMACION QUE
PROPORCIONA UNA MUESTRA
POBLACION
estudia una o varias características que son, de
alguna forma, observables
MUESTRA
es un subconjunto de la población
MUESTREO ALEATORIO SIMPLE
es aquel en el que todos los individuos de la población tienen la
misma probabilidad de ser elegidos
MUESTRA
ALEATORIA
SIMPLE
es un conjunto de n variables aleatorias X1,X2,...,Xn,
ESPACIO MUESTLAL
es el conjunto de muestras posibles que pueden
obtenerse al seleccionar una muestra aleatoria,
PARAMETRO
es cualquier característica medible (media, varianza,..).
ESTADISTICO
Por tanto, es una variable aleatoria que
tiene una función de distribución que se
denomina
PROPIEDAD
DE LOS
ESTIMADORES
Sea ^h n = ^h n(X ,X ,... ,X ) 1 2 n
un estimador del parámetro h
2.2 DISTRIBUCION DEL
MUESTREO
es la distribución de probabilidad
de una muestra de una población
en lugar de toda la población.
pueden variar dependiendo de cuán pequeña sea
la muestra en comparación con la población
media
cuando la muestra que se toma es
grande, conocido como el teorema del
límite central.
desviación estándar
es diferente para la
distribución de muestreo
en comparación con la
población
VARIANZA
es empleada para inferir la
varianza de la población,
mediante la distribución de
muestreo
ESTIMACION PUNTUAL
El objetivo de la estimación puntual es aproximar el valor del parámetro desconocido. Para ello se utiliza la
información de la muestra ( x 1 , x 2 , … , x n ) , a través de un estimador.
Algunos estimadores frecuentes son
Media muestral
para estimar la
media teórica de
una variable X . ¯
x = x 1 + ⋯ + x n n
Proporción muestral
para estimar una
proporción p : ˆ p = x 1 + ⋯
+ x n n , siendo x 1 , … , x n
una muestra aleatoria
simple de la variable X ∈ B (
1 , p ) , es decir, son unos o
ceros.
Varianza muestral
para estimar la varianza
teórica de una población, se
puede usar la varianza de una
muestra: S 2 = ( x 1 − ¯ x ) 2 +
⋯ + ( x n − ¯ x ) 2 n ,
Cuasi-varianza muestral
para estimar la
varianza teórica
de una población,
se puede usar la
varianza de una
muestra: S 2 = ( x
1 − ¯ x ) 2 + ⋯ + ( x
n − ¯ x ) 2 n ,
ESTIMACION DE
INTERVALOS
La estimación por intervalos consiste en establecer
el intervalo de valores donde es más probable se
encuentre el parámetro.
Parámetro (estimador + z x EE del estimador)
El intervalo de confianza calculado dependerá de:
estimado en la muestra
(porcentaje, media,..) El I.C. está formado por valores
ligeramente menores y mayores que la aproximación
ofrecida por la muestra.
tamaño muestral
Cuantos más datos hayan participado
en el cálculo, más pequeño esperamos
que sea la diferencia entre el valor
estimado y el valor real desconocido.
intervalo de confianza para medias
distribución Normal
el objetivo es la construcción de un intervalo de
confianza para el parámetro μ, basado en una
muestra de tamaño n de la variable.
Caso de varianza conocida
Dada una muestra X1, ..., Xn, el estadístico
se distribuye según una Normal estándar. Por tanto,
aplicando el método del pivote podemos construir la
expresión
donde zα/2 es el valor de una
distribución Normal estándar que deja a
su derecha una probabilidad de α/2, de
la que se deduce el intervalo de
confianza
Caso de varianza desconocida
Dada una muestra X1, ..., Xn, el estadístico
se distribuye según una t de Student de n − 1
grados de libertad. Por tanto, y siguiendo pasos
similares a los del apartado anterior, el intervalo
de confianza resultante es
donde tα/2 es el valor de una distribución t
de Student con n − 1 grados de libertad que
deja a su derecha una probabilidad de α/2.
intervalo de
confianza para
diferencia entre
medias
se debe saber si las
varianzas
poblacionales son
conocidas o
desconocidas
Para calcular el intervalo de confi
anza para la diferencia de dos
medias
se debe saber si las varianzas poblacionales son
conocidas o desconocidas
desconocidas
se debe probar si son igual
es o diferentes.
Cada uno de estos tres casos se analizarán por
separado
una distribución normal
El objetivo es construir un intervalo de
confianza, con nivel de confianza (1 − α) ·
100 %, para la diferencia de medias µ1 −
µ2
si las dos poblaciones
son normales, o
aproximadamente
normal
si cumple con las
condiciones del
teorema del limite
central
intervalo de confianza para
proporciones
sirve para calcular la estimacion de la proporcion de
elementos de una poblacion que tiene ciertas
caracteristicas de interes
Considerar la aproximación
asintótica de la distribución
Binomial en la distribución Normal.
Tiene la ventaja de la simplicidad en la
expresión y en los cálculos, y es la más
referenciada en la mayoría de textos de
estadística
Se basa en la aproximación
Utilizar un método exacto.
Es posible demostrar que un
intervalo exacto para el parámetro
p viene dado por los valores
siguientes:
intervalo de confianza para
diferencias entre
proporciones
Este intervalo puede utilizarse de manera
alternativa al contraste de hipótesis
donde el símbolo zα/2 es el mismo valor crítico que antes, prob(Z > zα/2) = α/2, y
corresponde a un intervalo de confianza 1 − α %
Un intervalo puede utilizarse de manera alternativa al contraste de hipótesis
para decidir
Aunque se haga el contraste de dos proporciones, en primer lugar, es aconsejable
obtener el intervalo de confianza de la diferencia de medias
si éste ha resultado significativo, puesto que ayudará a interpretar si existe significación
aplicada además de la estadística.
intervalo de confianza para varianza
el objetivo es la construcción de un
intervalo de confianza para el parámetro
σ, basado en una muestra de tamaño n
de la variable
Para estimar un intervalo de confianza
para la varianza, nos ayudaremos de la
siguiente propiedad de la distribucion x2:
Un intervalo de confianza al nivel 1 − α para la
varianza de una distribuci´on gaussiana (cuyos
par´ametros desconocemos) lo obtenemos
como
Ejemplo
Se estudia la altura de los individuos de una
ciudad, obteni´endose en una muestra de
tama˜no 25 los siguientes valores:
x = 170 cm
S = 10 cm
Calcular un intervalo de confianza con α =
0, 05 para la varianza σ 2 de la altura de los
individuos de la ciudad.
Solucion:
σ 2 ∈ [63, 45 ; 201, 60]
intervalos de confianza para razones de dos varianzas
Supondremos la existencia de dos poblaciones
sobre las que una determinada variable sigue una
distribución Normal.
Sobre la población 1 la variable sigue una
distribución N(µ1, σ1) y sobre la población 2
sigue una distribución N(µ2, σ2).
dos muestras aleatorias independientes
El objetivo es construir un intervalo de
confianza, con nivel de confianza (1 − α) ·
100 %, para el cociente de varianzas
Las circunstancias
específicas para la
construcción de este
intervalo son las siguientes
Intervalo para el cociente de dos varianzas
poblacionales
Evidentemente si plantemos medir la diferencia entre las
varianzas , cuanto más próximo se la razón a la unidad menor
diferencia habrá entre las varianzas y lógicamente cuando la
razón entre estas difiera mucho de 1 ,la diferencia entre
varianzas será mas ostensible.