Zusammenfassung der Ressource
ESTADISTICA
DESCRIPTIVA
- La estadística descriptiva es una ciencia que
analiza series de datos (por ejemplo, edad de
una población, altura de los estudiantes de
una escuela, temperatura en los meses de
verano, etc) y trata de extraer conclusiones
sobre el comportamiento de estas variables.
- Las variables pueden ser de dos tipos:
- Variables cualitativas o atributos: no se pueden medir
numéricamente (por ejemplo: nacionalidad, color de la piel, sexo).
- Variables cuantitativas: tienen valor numérico (edad,
precio de un producto, ingresos anuales).
- Las variables también se pueden clasificar en:
- Variables unidimensionales: sólo recogen información sobre una
característica (por ejemplo: edad de los alunmos de una clase).
- Variables bidimensionales: recogen información sobre dos
características de la población (por ejemplo: edad y altura de
los alumnos de una clase).
- Variables pluridimensionales: recogen información
sobre tres o más características (por ejemplo:
edad, altura y peso de los alumnos de una clase).
- Por su parte, las variables cuantitativas se
pueden clasificar en discretas y continuas:
- Discretas: sólo pueden tomar valores enteros (1, 2, 8, -4, etc.). Por
ejemplo: número de hermanos (puede ser 1, 2, 3....,etc, pero, por
ejemplo, nunca podrá ser 3,45).
- Continuas: pueden tomar cualquier valor real dentro de un intervalo.
Por ejemplo, la velocidad de un vehículo puede ser 80,3 km/h, 94,57
km/h...etc.
- Cuando se estudia el comportamiento de
una variable hay que distinguir los siguientes
conceptos:
- Individuo: cualquier elemento que porte información sobre el fenómeno que
se estudia. Así, si estudiamos la altura de los niños de una clase, cada
alumno es un individuo; si estudiamos el precio de la vivienda, cada vivienda
es un individuo.
- Población: conjunto de todos los individuos (personas,
objetos, animales, etc.) que porten información sobre el
fenómeo que se estudia. Por ejemplo, si estudiamos el
precio de la vivienda en una ciudad, la población será el total
de las viviendas de dicha ciudad.
- Muestra: subconjunto que seleccionamos de la población. Así, si se estudia el precio
de la vivienda de una ciudad, lo normal será no recoger información sobre todas las
viviendas de la ciudad (sería una labor muy compleja), sino que se suele seleccionar un
subgrupo (muestra) que se entienda que es suficientemente representativo.
- La distribución de frecuencia es la representación estructurada,
en forma de tabla, de toda la información que se ha recogido
sobre la variable que se estudia.
- Medidas de posición central
- Las medidas de posición nos facilitan información sobre la serie de datos que estamos analizando. Estas
medidas permiten conocer diversas características de esta serie de datos.
- Las medidas de posición son de dos tipos
- Medidas de posición no centrales: informan de como se distribuye el resto
de los valores de la serie.
- Medidas de posición central: informan sobre los valores medios de
la serie de datos.
- Las principales medidas de posición central son las siguientes:
- Media: es el valor medio ponderado de la serie de datos. Se pueden calcular diversos tipos de media, siendo
las más utilizadas:
- Media aritmética: se calcula multiplicando cada valor por el
número de veces que se repite. La suma de todos estos
productos se divide por el total de datos de la muestra: Xm =
(X1 * n1) + (X2 * n2) + (X3 * n3) + .....+ (Xn-1 * nn-1) + (Xn * nn)
---------------------------------------------------------------------------------------
n
- Media geométrica: se eleva cada valor al número de veces que
se ha repetido. Se multiplican todo estos resultados y al producto
fiinal se le calcula la raíz "n" (siendo "n" el total de datos de la
muestra).
- Media geométrica: se eleva cada valor al número de veces que se ha
repetido. Se multiplican todo estos resultados y al producto fiinal se le
calcula la raíz "n" (siendo "n" el total de datos de la muestra).
- Mediana: es el valor de la serie de datos que se sitúa justamente en el centro de la
muestra (un 50% de valores son inferiores y otro 50% son superiores).
- Moda: es el valor que más se repite en la muestra.