Datos == Estadigrafos
(Media aritmética o
desviación estándar de la
distribución)
Pueden ser inferidos
Procedimientos inferenciales
Probar Hipótesis poblacionales
Estimar parámetros
Las Estadísticas de la población == Parámetros
(No son calculados, no es igual a toda la
población)
Depende de elegir una muestra con un tamaño que
asegure un nivel de significancia
¿EN QUÉ CONSISTE LA PRUEBA DE HIPÓTESIS?
Es una proposición a uno o varios parámetros
Determinar si una Hipótesis es congruentes con
los datos obtenidos en la muestra
¿QUÉ ES LA DISTRIBUCIÓN MUESTRAL?
Conjunto de valores sobre una estadística calculada de
todas las muestras posibles de determinado tamaño de una
población
La muestra podría elegirse al azar y las veces que fuese necesarias
En cada una de la muestras se obtendría una media
Con estas elaborariamos una distribución de medias
El calculo de la media de todas las medias de las muestras está la media de
la población
Si la media calculada se encuentra cerca de la distribución muestral, podemos
tener una estimación precisa de la media poblacional ( se le llama: teorema
central del límite)
Si la población tiene una media (m), y una desviación
estándar (s) la distribución de la medias del
muestreo aleatorea realizado en esta población
tiende al aumentar (n); a una distribución normal de
media (m) y distribución estándar (s/sqrt(n)), donde
(n) es el tamaño de la muestra
Varianza == Varianza de la población entre el tamaño de la muestra
Con base se creó un modelo de probabilidad llamada
curva normal o distribución normal
CARACTERÍSTICAS
Unimodal == una sola moda
Asimetría == Cero, la mitad de la curva es igual a la otra.
Función particular entre desviación
respecto a la media de la una distribución
y las probabilidades de que estas ocurran
La base está dada en unidades de desviación
estándar ( puntuaciones z), destacando la s
puntuaciones, las distancias entre puntuaciones z
que representan áreas bajo la curva.
La mesocúrtica (custosis de cero)
La media, mediana y moda coinciden en el mismo punto (centro)
¿QUÉ ES EL NIVEL DE SIGNIFICACIA?
Probabilidad de que un evento
ocurra está entre "cero y uno",
Cero == NO y Uno == SI
Para probar la Hipótesis inferencial respecto a la Media,
el investigador evalua si es alta o baja la probabilidad de
que la Media de la muestra esté cerca de la media de la
distribución muestral.
BAJA == DUDA (No generaliza la
población)
ALTA == EXITOSA (Puede hacer
generalizaciones de la población)
PORCENTAJE DE CONFIANZA PARA GENERALIZAR (CERCANIA U ERROR)
El nivel de significancia es de 0.05, el
invetigador cuenta con 95% de seguridad
(Ciencias sociales)
El nivel de significancia es de 0.01, El
investigador cuenta 99% de seguridad
DISTRIBUCIÓN MUESTRAL Y NIVEL DE SIGNIFICACIA (RELACIÓN)
Se expresan en términos de probabilidad
Para medir la confianza acudimos a la distribución muestral
De dicho nivel lo tomamos como una área baja la distribución
muestral, dependiente si distribuimos el nivel del 0.05 y 0.01
¿SE PUEDE COMETER ERRORES AL PROBAR UNA HIPÓTESIS Y REALIZAR ESDISTICA INFERENCIAL?
"No estariamos completamente seguros pero se puede caer en errores con riesgos mínimos"
Aceptando una hipótesis verdadera
Rechazar una Hipótesis falsa
Aceptar una Hipótesis falsa "Error Beta"
Rechazar una Hipótesis verdadera "Error Alpha"
Los dos tipos de error son indeseables. Sin embargo pueden reducirse sustancialmente la posibilidad
Muestras probabilísticas representativas
Inspeccíon cuidadosa de los datos
Selección de las pruebas estadísticas apropiadas
Mayor conocimiento de la población
PRUEBA DE HIPÓTESIS
Existen dos tipos
Análisis paramétricos
SE PUEDEN USAR LAS DOS SEGÚN LA NECESIDAD
Planteamiento
Tipo de Hipótesis
Nivel de medición
de las variables que
la conforman
Distribución poblacional de la variable
dependiente es normal (El universo
tiene una distribución normal)
El nivel de medición de la
variables es por Intervalos
o Razón
Cuando dos o más poblaciones son estudiadas, tienen una
varianza homogénea ( poseen una dispersión similar en
sus distribuciones)
MÉTODOS MÁS USADOS
Coeficiente de correlación de Pearson y Regresión lineal
Prueba estadística para analizar la relación
entre dos variables, medidas en un nivel por
intervalos o razón. (Coeficiente
producto-momento)
Intervalos
El signo indica la dirección de la
correlación (positiva o negativa). El valor
numérico la magnitud de la correlación
METODOLOGÏA
Simboliza: r
Hipótesis a probar: Correlación del tipo de "a
moyor X, mayor Y", " amayor X, menor Y", "altos
valores en X,están asociados en altos valore en
Y", "altos valores en X e asocian con bajos
valores en Y"
La Hipótesis señala que la correlación es significativa
Variable: Dos, No evaluan
causalidad; se establece
teoricamente, pero la prueba
no asume dicha causalidad
Se calcula de las puntuaciones de una muestra
de dos variables
Se relaciona la puntuaciones
recolectadas de una variable con
puntuaciones obtenida de la otra
Nivel de medición de las variables: Intervalos o razón
Interpretación: Coeficiente r de
Pearson puede variar de -1 a +1, donde
-1 == correlación negativa perfecta
(Mayor X, Menor Y de manera
proporcional)
Consideraciones: Cuando el coeficiente r de Pearson va al cuadrado es igua al "Coeficiente de
determinación". Su resultado indica la varianza de "factores comunes" que es el porcentaje de
variación de una variable debido a la variación de la otra variable y viceversa.
El Coeficiente de determinación ofrece una buena predicción de
una variable respecto a la otra, y por encima de la variable con
mayor valor implica que ambas variables miden casí el mismo
concepto subyacente, "son cercanamente un constructo
semejante"
Este coeficiente de correlación de Pearson es útil para
las relaciones lineales en la regresión lineal, pero no en
las curvilineales
Qué es Regresión Lineal
Modelo estadístico para estimar el efecto de una variable sobre otra.
Asociado al Coeficiente r de Pearson
Brinda la oportunidad de predecir las puntuaciones de una
variable a partir de las puntuaciones de otra variable
Los diagramas de dispersión son una
manera de visualizar gráficamente una
correlación
Si cada punto representa un caso y un
resultado de la intersección de las
puntuaciones de ambas variables. El
diagrama de dispersión puede ser
resumido a una linea si hay tendencia;
conociendo la línea y la tendencia
podemos predecir los valores de una
variable conociendo los valores de la
otra
Se miden mediante la
evaluación de la pendiente
que es igual a ecuación de
relación lineal.
y = variable dependiente a predecir
a = la ordenada en el origen
b = la pendiente o inclinación
x = valor que fijados en la variable independiente
Entre mayor sea la correlacioón entre la variables (covariación), mayor
capacidad de predicción
METODOLOGÏA
Hipótesis: Correlaciones y causales
Variables: dos, una dependiente y otra independiente, hay que
tenerse un buen sustento teoríco
Nivel de medición de las variable: intervalos o Razón
Procedimientos e interpretación: La regresión lineal se determina
con base en el diagrama de dispersión. Es una gráfica en el que
se relacionan las puntuaciones de una muestra en dos variables
Consideraciones: La regresión lineal es útil con regresiones lineales
Existen relaciones de causa-efecto que no son lineales
Prueba t
Es una prueba estadística para evaluar si dos grupos difieren entre sí de
manera significativa, respecto a sus medias en una variable
Se basa en una distribución muestral o poblacional de
diferencia de media conocida como la distirbución t de
Student, que se identifica por los grados de libertad
(puede variar libremente)
Cuanto mayor número de "grados de libertad" se
tenga, la distribución t de Student se acercará más
una distribución normal, se calcula con la formula
en la que n1 y n2 son el tamaño de los grupos que
se acompañan.
La Ecuación sirve para hacer
contrastes de Género
METODOLOGÍA
Simboliza: t
Hipótesis: Diferencia de dos
grupos, la Hipótesis nula plantea
que los grupos no difieren
Variables: La comparación se realiza sobre una
variable, si hay diferentes variables se efectua varia
pruebas t. Una por cada variable y la razón que
motiva la creación de los grupos puede ser una
variable independiente
Nivel de medición de la variable de comparación:
intervalos o razón
Cálculo e interpretación: El valor t es cálculado por un
programa estadístico, de todos los resultados los más
necesarios para la interpretación, son el valor t y su
significancia
Consideraciones: La prueba t se utiliza para
comparar los resultados de una preprueba con
los resultados de una posprueba en un cotexto
experimental
Se comparan las medias y las varianzas del
grupo en dos momentos diferentes o bien
para comparar los prepruebas o pospruebas
de los grupos que participan en el
experimento. El nivel de confianza debe ser
menor de 0.05 o 0.01
¿QUÉ ES ELTAMAÑO DEL EFECTO?
Se determina al comparar los grupo de
la prueba t
Es una medida de la "fuerza" de las
medias y otros valores considerados
Resulta ser una medida en unidades de
desviación estándar
"La desviación estándar
sopesada es la estimación
reunida de la desviación
estándar de ambos grupos"
Ne y Nc: Tamaño de los grupos (Grado de libertad)
SDe y SDc: Son desviaciones estándar
Prueba de contraste de las diferencias de proporciones
Análisis de varianza Unidireccional ( ANOVA en un sentido)