Zusammenfassung der Ressource
ANÁLISIS DE DATOS UNIDIMENSIONALES
- MEDIDAS DE POSICIÓN
- En general, las medidas de posición indican
un valor de la variable en torno al cual se
sitúan un grupo de observaciones.
- Puede distinguirse entre
- Medidas de tendencia central
- Media aritmética
- Es la suma de todos los valores de la variable
divididos por el número total de
observaciones.
- esta medida sólo se puede calcular si la
variable estadística objeto de estudio es de
naturaleza cuantitativa.
- El valor que toma la media debe estar siempre
incluido entre el valor mínimo y máximo del
dominio de la variable analizada.
- Media armónica
- La media armónica, que
se denota por Mh
- se define como
- distribución de frecuencia de
valores sin agrupar
- frecuencias unitarias
- numero impar de observaciones
- numero par de observaciones
- frecuencias no unitarias
- Media geometrica
- Que es empleada cuando las variables son de
naturaleza multiplicativa en el sentido
- se denota por Mg
- la hora de calcular la media geométrica suele
utilizarse que el logaritmo de la media
geométrica que es igual a la media aritmética de
los logaritmos de los valores de la variable
- Mediana
- que se denota por Me, es un valor del
recorrido de la variable que deja el mismo
número de observaciones a su izquierda y a
su derecha.
- Distribuciones de frecuencias de
valores sin agrupar
- Al trabajar con valores sin agrupar hay que
considerar varias posibles situaciones
- Situación 1
- Distribución de frecuencias unitarias
- Situación 2.
- Distribución de frecuencias no unitarias
- Distribuciones de frecuencias
agrupadas
- Este caso tiene menos interés, pues
actualmente no se suele trabajar con datos
agrupados, dado que la informática permite
manejar mucha información sin necesidad de
perder parte de ella en agrupaciones.
- Moda
- La moda de una distribución, a la que se denotará por
Mo, representa el valor de la variable con mayor
frecuencia. No tiene por qué ser única.
- si hay dos o más valores de la variable que tienen la
misma frecuencia, siendo esta la mayor, se estará
ante una distribución multimodal (bimodal, dos
modas; trimodal, tres modas; etc.).
- Del mismo modo que se procedió con la mediana,
para determinar la moda debe distinguirse entre
distribuciones de valores sin agrupar y agrupados.
- Distribuciones de frecuencias de valores sin agrupar
- En este caso, y según la definición de la moda,
hay que fijarse en cuál es el valor de la variable
que más se repite, el de mayor frecuencia.
- Distribuciones de frecuencias de valores agrupados
- Cuando se trabaja con valores agrupados en intervalos, lo
más sencillo para determinar el valor modal consiste en
dibujar el histograma.
- Medidas de tendencia no central
- Cuantiles
- Las familias de cuantiles más utilizadas son aquellas
que dividen la distribución de frecuencias en cuatro,
diez y cien partes.
- Cuartiles (k = 4):
- son tres valores (Cs, s = 1, 2, 3) del recorrido que
dividen la distribución en 4 partes, conteniendo
cada una de ellas el 25% de las observaciones.
- Deciles (k = 10):
- son nueve valores del recorrido (Ds, s = 1, 2, …, 9) que dividen
la distribución en 10 partes, de tal forma que cada una de
ellas contendrá el 10% de las observaciones.
- Percentiles (k = 100):
- son noventa y nueve valores del recorrido (Ps, s = 1, 2, …,
99) que dividen la distribución en 100 partes, conteniendo
cada una de ellas el 1% de las observaciones.
- MEDIDAS DE DISPERSIÓN
- El término dispersión o variabilidad hace referencia a cómo de
distantes, de separados, se encuentran los datos.
- Rango
- es la diferencia entre el valor máximo y mínimo, es decir, Re = xmax − xmin. La
principal desventaja de este tipo de medida de dispersión es que únicamente
tiene en cuenta dos valores de la variable.
- Varianza
- que se denota por S2X, se define como la media aritmética
de los cuadrados de las diferencias de los valores de la
variable a la media aritmética
- pretende medir la dispersión que presentan los valores de la variable
respecto de su media. Cuanto mayor sea la varianza, cuanto mayor sea la
dispersión, menos representativa resultará ser la media.
- Desviación típica
- es una medida de dispersión que suele proporcionarse junto con la
media de la distribución, puesto que ambas magnitudes vienen
expresadas en la misma unidad de medida, lo que facilita
enormemente la interpretación de los resultados.
- Coeficiente de variación
de Pearson
- Es el cociente entre la desviación típica y la media aritmética de la
variable estadística X. Suele representarse por g0(X).
- es una medida de dispersión relativa. Por esta razón, se utiliza
para comparar la dispersión entre dos o más distribuciones,
independientemente del valor de sus medias y de la unidad de
medida de las variables.
- MOMENTOS
- A partir de la distribución de frecuencias es posible calcular
una serie de valores específicos que la caracterizan. Estos
valores son los denominados momentos.
- Momentos ordinarios o respecto al origen
- Dada una variable estadística unidimensional (X) y su
distribución de frecuencias, se define el momento
ordinario (o respecto al origen) de orden p, que se denota
por ap(X)
- Momentos centrales o respecto a la media
- Dada una variable estadística unidimensional (X) y su
distribución de frecuencias, se define el momento
central (o respecto a la media) de orden p, que se denota
por mp(X)
- Relación entre los momentos ordinarios y centrales
- Es posible expresar cualquier momento central en
función de los momentos ordinarios.
- MEDIDAS DE FORMA
- En este apartado se va a comparar una
determinada distribución de frecuencias con un
modelo ideal, la distribución Normal (que tiene
forma de campana). La comparación se centrará,
básicamente, en dos aspectos fundamentales.
- Medidas de asimetría
- Para medir la asimetría de una distribución pueden utilizarse
diferentes coeficientes, aunque es frecuente obtener el
denominado coeficiente de asimetría (de Fisher), que se
denota por g1, y se define como el cociente entre el momento
central de orden 3 y la desviación típica elevada al cubo.
- Medidas de apuntamiento (curtosis)
- Las medidas de apuntamiento analizan si una
distribución de frecuencias es más apuntada o
menos al comparar ésta con una distribución
tipo, la distribución Normal con su misma media
y varianza.
- TRANSFORMACIONES LINEALES Y
TIPIFICACIÓN DE VARIABLES
- Supóngase que, en principio, se está trabajando
con la distribución de frecuencias de una variable
estadística X, de la que se ha obtenido una serie
de estadísticos (media, varianza, etc,) y que por
cualquier circunstancia es necesario pasar a
trabajar con otra variable estadística Y, que se
obtiene a partir de la anterior como resultado de:
- Sumar (o restar) una constante a a todos los valores de
la variable estadística X, es decir, de efectuar sobre ésta
un cambio de origen: Y = X + a o Y = X - a.
- Multiplicar (o dividir) por una constante b todos los
valores de la variable X, es decir, de realizar sobre X un
cambio de unidad (o escala): Y = b · X o .
- Practicar sobre la variable X tanto un cambio de
unidad como de origen, por ejemplo: Y = b · X + a.
- MEDIDAS DE CONCENTRACIÓN: CURVA DE
LORENZ E ÍNDICE DE GINI
- Las medidas de concentración, que no se deben confundir como
opuestas a las medidas de dispersión, indican el mayor o menor
grado de igualdad en el reparto total de los valores de la variable
objeto de estudio.
- La concentración puede determinarse gráficamente a
través de la curva de Lorenz. Una medida analítica para la
concentración es el conocido como índice de Gini.
- Curva de Lorenz
- se relaciona el porcentaje acumulado de
frecuencias (pi)—hogares, familias, individuos,
trabajadores, industrias, etc.—,
- Índice de Gini
- que se denota por IG, es aproximadamente el cociente
entre el área comprendida entre la bisectriz del primer
cuadrante y la curva de Lorenz y el triángulo
- Haciendo operativo el índice
de Gini y la curva de Lorenz
- es necesario calcular los porcentajes acumulados de
individuos y del volumen total de Para ello, lo más
práctico consiste en añadir columnas a la tabla de
frecuencias original