Conjunto de estrategias de obtención y procesamiento de
información que emplean magnitudes numéricas y técnicas formales
y/o estadísticas para llevar a cabo su análisis, siempre enmarcados en
una relación de causa y efecto.
Estadistica
Recopilación,
organización y
resumen de datos
Obtención de
información sobre
un conjunto de datos
Población
Totalidad de
unidades de un
fenómeno de
estudio
Muestra
Parte
representativa
de la población
Muestreo
Método utilizado
para seleccionar
los componentes
de la muestra
Probabilidad
Axiomas de probabilidad
El valor de la
probabilidad
entre 1 y 0
0≤P(A)≤1
Probabilidad de que
ocurra un evento del
espacio muestral es
igual a 1
E=AUA
P(A)+P(A)=1
Dos sucesos A y B
son excluyentes sino
pueden ocurrir de
manera simultanea
A∩B=Ø
Dos eventos son
compatibles si su
intercepción es diferente
del vació y de 0
Concepto de independencia
Eventos A y B son ind.
si la aparición de
cualquiera no afecta la
probabilidad del otro
P(A|B)= P(A)
P(B|A)=P(B)
Probabilidad condicionada
Cociente entre los casos
favorables y posibles
dentro de aquellos que
cumplen una condición
Distribucion normal
Cuando una variable X sigue una
distribución normal de media 𝜇
poblacional y varianza poblacional
o es la desviación típica σ, se dice
que X pertenece a una normal, con
media 𝜇 o varianza σ^2
Tipificación
Expresa que tanto
se alejan los datos
respecto al
promedio en
términos de
desviación
estándar
Tabla de frecuencias de una
variable discreta
Es una representación
tabular que muestra la
cantidad de veces que se
repiten los diferentes
valores de una variable
discreta.
Valores de la
variable: Los
diferentes valores
que puede tomar la
variable.
Frecuencia absoluta (f): El
número de veces que cada
valor de la variable aparece
en el conjunto de datos.
Frecuencia relativa (fr): La
proporción de la frecuencia
absoluta respecto al total de
observaciones (f/N).
Frecuencia acumulada (Fa): La
suma acumulada de las
frecuencias absolutas hasta un
determinado valor.
Agrupamiento de
intervalos de clase
Se utiliza cuando se tienen
datos continuos o una
gran cantidad de datos
discretos. Consiste en
agrupar los datos en
rangos o intervalos de
clase para simplificar el
análisis y la
interpretación.
Cada intervalo de clase tiene
un límite inferior y
superior, y todos los datos
que caen dentro de ese
rango se contabilizan en ese
intervalo. La frecuencia de
cada intervalo se representa
en una tabla de frecuencias
agrupadas.
Variable
Nominal
Es una variable cualitativa
que se utiliza para
etiquetar categorías sin
ningún orden específico.
Los valores de una variable
nominal son mutuamente
excluyentes y exhaustivos
Género (masculino,
femenino), Estado
civil (soltero, casado,
divorciado), Color de
ojos (azul, verde,
marrón)
Contraste de
hipótesis
Al valor numérico
(efecto) se relaciona con
la variabilidad aleatoria
esperada (error)
Decidir entre:
Ho
El efecto de
interés no
existe en la
población
Ha
Mantiene que
existe algún efecto
distinto de 0 en la
población
Medidas de dispersión
Varianza (σ² o s²): Es una medida
que indica la dispersión de los
valores de una variable respecto a
su media. Se calcula como el
promedio de los cuadrados de las
diferencias entre cada valor y la
media.
Desviación típica (σ o s): Es la raíz
cuadrada de la varianza.
Proporciona una medida de
dispersión en las mismas unidades
que los datos originales.
Cuartiles: Dividen un conjunto
de datos ordenados en cuatro
partes iguales. Los tres cuartiles
(Q1, Q2, Q3) corresponden al
25%, 50% (mediana) y 75% de los
datos, respectivamente.
Deciles: Dividen un conjunto
de datos en diez partes
iguales. Cada decil representa
un 10% del conjunto de datos.
Percentiles: Dividen un
conjunto de datos en cien
partes iguales. Cada
percentil representa un
1% del conjunto de datos.
Asimetría: Mide la simetría de la
distribución de los datos. Una
distribución simétrica tiene una
asimetría de cero. Si la asimetría es
negativa, la cola izquierda es más
larga o tiene más valores extremos
que la cola derecha (sesgo a la
izquierda). Si es positiva, la cola
derecha es más larga (sesgo a la
derecha).
Curtosis: Mide la "agudeza" de la
distribución de los datos. Una
distribución con alta curtosis
tiene colas más largas y picos más
altos que una distribución normal
(leptocúrtica). Una distribución
con baja curtosis tiene colas más
cortas y un pico más plano
(platicúrtica). La curtosis de una
distribución normal es 3.
El coeficiente de curtosis se calcula
generalmente restando 3 de la
curtosis muestral para compararla
con la distribución normal. Este
coeficiente indica si la distribución
tiene colas más largas y picos más
altos (positiva) o colas más cortas y
picos más planos (negativa) en
comparación con la normal.
Medidas centrales de distribución
Promedio (media aritmética): Es la
suma de todos los valores de un
conjunto de datos dividida por el
número total de valores.
Representa el valor central de un
conjunto de datos.
Mediana: Es el valor que separa la
mitad superior de la mitad inferior
de un conjunto de datos
ordenados. Si el número de
observaciones es impar, es el valor
medio; si es par, es el promedio de
los dos valores centrales.
Moda: Es el valor que aparece
con mayor frecuencia en un
conjunto de datos. Un conjunto
de datos puede tener más de una
moda (bimodal, multimodal) o
no tener ninguna (amodal).
Teorema del limite
central y distribución de
medias centrales
Se obtiene K muestras de la
población con n mediciones y
se calcula el promedia para
cada muestra
Teorema del
limite central
Para predecir el
comportamiento de
una distribución de
medias muestrales