Zusammenfassung der Ressource
Análisis
cuantitativos
- Conjunto de estrategias de obtención y procesamiento de
información que emplean magnitudes numéricas y técnicas formales
y/o estadísticas para llevar a cabo su análisis, siempre enmarcados en
una relación de causa y efecto.
- Estadistica
- Recopilación,
organización y
resumen de datos
- Obtención de
información sobre
un conjunto de datos
- Población
- Totalidad de
unidades de un
fenómeno de
estudio
- Muestra
- Parte
representativa
de la población
- Muestreo
- Método utilizado
para seleccionar
los componentes
de la muestra
- Probabilidad
- Axiomas de probabilidad
- El valor de la
probabilidad
entre 1 y 0
- 0≤P(A)≤1
- Probabilidad de que
ocurra un evento del
espacio muestral es
igual a 1
- E=AUA
- P(A)+P(A)=1
- Dos sucesos A y B
son excluyentes sino
pueden ocurrir de
manera simultanea
- A∩B=Ø
- Dos eventos son
compatibles si su
intercepción es diferente
del vació y de 0
- Concepto de independencia
- Eventos A y B son ind.
si la aparición de
cualquiera no afecta la
probabilidad del otro
- P(A|B)= P(A)
- P(B|A)=P(B)
- Probabilidad condicionada
- Cociente entre los casos
favorables y posibles
dentro de aquellos que
cumplen una condición
- Distribucion normal
- Cuando una variable X sigue una
distribución normal de media 𝜇
poblacional y varianza poblacional
o es la desviación típica σ, se dice
que X pertenece a una normal, con
media 𝜇 o varianza σ^2
- Tipificación
- Expresa que tanto
se alejan los datos
respecto al
promedio en
términos de
desviación
estándar
- Tabla de frecuencias de una
variable discreta
- Es una representación
tabular que muestra la
cantidad de veces que se
repiten los diferentes
valores de una variable
discreta.
- Valores de la
variable: Los
diferentes valores
que puede tomar la
variable.
- Frecuencia absoluta (f): El
número de veces que cada
valor de la variable aparece
en el conjunto de datos.
- Frecuencia relativa (fr): La
proporción de la frecuencia
absoluta respecto al total de
observaciones (f/N).
- Frecuencia acumulada (Fa): La
suma acumulada de las
frecuencias absolutas hasta un
determinado valor.
- Agrupamiento de
intervalos de clase
- Se utiliza cuando se tienen
datos continuos o una
gran cantidad de datos
discretos. Consiste en
agrupar los datos en
rangos o intervalos de
clase para simplificar el
análisis y la
interpretación.
- Cada intervalo de clase tiene
un límite inferior y
superior, y todos los datos
que caen dentro de ese
rango se contabilizan en ese
intervalo. La frecuencia de
cada intervalo se representa
en una tabla de frecuencias
agrupadas.
- Variable
Nominal
- Es una variable cualitativa
que se utiliza para
etiquetar categorías sin
ningún orden específico.
Los valores de una variable
nominal son mutuamente
excluyentes y exhaustivos
- Género (masculino,
femenino), Estado
civil (soltero, casado,
divorciado), Color de
ojos (azul, verde,
marrón)
- Contraste de
hipótesis
- Al valor numérico
(efecto) se relaciona con
la variabilidad aleatoria
esperada (error)
- Decidir entre:
- Ho
- El efecto de
interés no
existe en la
población
- Ha
- Mantiene que
existe algún efecto
distinto de 0 en la
población
- Medidas de dispersión
- Varianza (σ² o s²): Es una medida
que indica la dispersión de los
valores de una variable respecto a
su media. Se calcula como el
promedio de los cuadrados de las
diferencias entre cada valor y la
media.
- Desviación típica (σ o s): Es la raíz
cuadrada de la varianza.
Proporciona una medida de
dispersión en las mismas unidades
que los datos originales.
- Cuartiles: Dividen un conjunto
de datos ordenados en cuatro
partes iguales. Los tres cuartiles
(Q1, Q2, Q3) corresponden al
25%, 50% (mediana) y 75% de los
datos, respectivamente.
- Deciles: Dividen un conjunto
de datos en diez partes
iguales. Cada decil representa
un 10% del conjunto de datos.
- Percentiles: Dividen un
conjunto de datos en cien
partes iguales. Cada
percentil representa un
1% del conjunto de datos.
- Asimetría: Mide la simetría de la
distribución de los datos. Una
distribución simétrica tiene una
asimetría de cero. Si la asimetría es
negativa, la cola izquierda es más
larga o tiene más valores extremos
que la cola derecha (sesgo a la
izquierda). Si es positiva, la cola
derecha es más larga (sesgo a la
derecha).
- Curtosis: Mide la "agudeza" de la
distribución de los datos. Una
distribución con alta curtosis
tiene colas más largas y picos más
altos que una distribución normal
(leptocúrtica). Una distribución
con baja curtosis tiene colas más
cortas y un pico más plano
(platicúrtica). La curtosis de una
distribución normal es 3.
- El coeficiente de curtosis se calcula
generalmente restando 3 de la
curtosis muestral para compararla
con la distribución normal. Este
coeficiente indica si la distribución
tiene colas más largas y picos más
altos (positiva) o colas más cortas y
picos más planos (negativa) en
comparación con la normal.
- Medidas centrales de distribución
- Promedio (media aritmética): Es la
suma de todos los valores de un
conjunto de datos dividida por el
número total de valores.
Representa el valor central de un
conjunto de datos.
- Mediana: Es el valor que separa la
mitad superior de la mitad inferior
de un conjunto de datos
ordenados. Si el número de
observaciones es impar, es el valor
medio; si es par, es el promedio de
los dos valores centrales.
- Moda: Es el valor que aparece
con mayor frecuencia en un
conjunto de datos. Un conjunto
de datos puede tener más de una
moda (bimodal, multimodal) o
no tener ninguna (amodal).
- Teorema del limite
central y distribución de
medias centrales
- Se obtiene K muestras de la
población con n mediciones y
se calcula el promedia para
cada muestra
- Teorema del
limite central
- Para predecir el
comportamiento de
una distribución de
medias muestrales