Herramientas gráficas
y numéricas variables
cualitativas
Descripción numérica de datos
cuantitativos: Estas medidas
permiten resumir la información
contenida en los datos. Son
exclusivas de este tipo de variables.
Herramientas
gráficas y numéricas
variables
cuantitativas
Medidas
de
posición:
Son valores que representan
las diferentes posiciones de un
conjunto de datos
Medidas de posición central
Media: apropiada cuando
los datos pueden ser
considerados como un solo
grupo, es decir
provenientes de una
misma población
Media muestral
Generalmente se
calcula en relación a
una muestra
Media aritmética
el valor que deja el 50% de los
datos por debajo y el 50% por
encima, una vez que los datos
han sido ordenados en forma
creciente.
Media geométrica
La raíz n-ésima del producto
de todos los valores numéricos
Media armónica
El número de observaciones de
la muestra dividido por la suma
del inverso de cada una de las
observaciones
Mediana (=2º cuartil y percentil 50): Es el
número central de un grupo de números
ordenados por tamaño. Si la cantidad de
términos es par, la mediana es el promedio
de los dos números centrales.
Moda: El valor que más se repite, aquel cuya
frecuencia absoluta es máxima. Puede ser
única, que haya más de una, o que no exista.
Medidas de otra posicón
Cuartiles
dividen a un conjunto de datos en cuatro partes iguales. Se
tienen tres cuartiles. El segundo coincide con la Mediana.
Deciles
dividen a un conjunto de datos en diez
partes iguales. Se tienen nueve deciles.
Percentiles
dividen a un conjunto de datos en 100 partes
iguales. Se tienen 99 percentiles
Describir datos es
Encontrar patrones
Entender el
comportamiento
de los datos
Es descubrir las princiales
relaciones h la historia que
tratan de contarnos
Tablas de frecuencia
Exponen la
información
recogida en
la muestra
de manera
inteligente:
Frecuencias absolutas:
Contabilizan el número de
individuos de cada modalidad.
Frecuencias relativas
(porcentajes unitarios): Ídem,
pero dividido por el total,
normalizadas.
Frecuencias acumuladas
absolutas y relativas: Acumulan
las frecuencias absolutas y
relativas. Son especialmente
útiles para calcular cuartiles
(como veremos más adelante).
Tipos de datos
Cualitativos
Pareto
Porcentaje
Pie/barras
Tablas
Cuantitativos
Histograma
Dispersión
Posición
Forma
Box Plot
Dispersión
Indican cuán homogéneos son los datos
Basadas en la distancia de los
datos con respecto a la media
Desviación
estándar
Varianza
Coeficiente de Variación
de Pearson
Se basa en la distancia entre cuartiles
Rango intercuartílico
Basadas en a distancia
entre los valores máximos
y mínimos
Rango
Forma
Las medidas de forma
nos dicen que
apariencia tiene la
distribución de los
datos
Si los valores de la serie de
datos presenta la misma forma a
izquierda y derecha de un valor
central (media aritmética) se
dice que es simétrica de lo
contrario será asimétrica.
Simetría
Asimetría
Se mide con el Coeficiente de Fisher
Resultados
g1 = 0 (distribución simétrica; existe la misma concentración
de valores a la derecha y a la izquierda de la media)
g1 > 0 (distribución asimétrica positiva; existe mayor
concentración de valores a la derecha de la media que a su
izquierda)
g1 < 0 (distribución asimétrica negativa; existe mayor
concentración de valores a la izquierda de la media que a su
derecha)
Curtosis
El Coeficiente de Curtosis analiza el
grado de concentración que presentan
los valores alrededor de la zona central
de la distribución. Nos indica el grado
de apuntamiento (aplastamiento) de
una distribución con respecto a la
distribución normal o gaussiana