1. Centro: valor promedio o representativo que indica la localización de la mitad del conjunto de datos.
2. Variación: la naturaleza o forma de la distribución de los datos (como en forma de campana, uniforme o sesgada). 3. Valores extremos: valores muestrales que están muy alejados de la vasta mayoría de los demás valores de la muestra. 4. Tiempo: características cambiantes de los datos a través del tiempo.
Distribuciones de frecuencias
Una distribución de frecuencias (tabla de frecuencias) lista valores de los datos (ya sea de manera individual o por grupos de intervalos), junto con sus frecuencias (o conteos) correspondientes.
Una frecuencia de una clase en particular es el número de valores originales “x” que ocurren en dicha clase.
<----EJEMPLO
1. Límites de clase inferiores: son las cifras más pequeñas que pueden pertenecer a las diferentes clases.
2. Límites de clase superiores: son las cifras más grandes que pueden pertenecer a las diferentes clases.
3. Fronteras de clase: son las cifras que se utilizan para separar las clases, pero sin los espacios creados por los límites de clase.
4. Marcas de clase: son los puntos medios de las clases. Se calculan sumando el límite de clase inferior con el límite de clase superior, y dividiendo la suma entre 2.
5. Anchura de clase: es la diferencia entre dos límites de clase inferiores consecutivos o dos fronteras de clase inferiores consecutivas.
Distribución de frecuencias relativas
Frecuencia relativa: se calcula dividiendo cada frecuencia de clase entre el total de frecuencias. En ocasiones se expresan como porcentajes.
Interpretación de las distribuciones de frecuencias
Distribución normal. Tiene como característica fundamental que el resultado gráfico tiene forma de “campana”; y al inicio las frecuencias son bajas, luego se incrementan hasta un punto máximo y luego disminuyen.
Histogramas
Es una gráfica de barras donde la escala horizontal representa clases de valores de datos y la escala vertical representa frecuencias. Las alturas de las barras corresponden a los valores de frecuencia; en tanto que las barras se dibujan de manera adyacente (sin huecos entre sí).
Histograma de frecuencias relativas
Un histograma de frecuencias relativas tiene la misma forma y escala horizontal que un histograma, pero la escala vertical está marcada con las frecuencias relativas en lugar de las frecuencias reales.
Términos
Simétrico: ambos lados de esta distribución son idénticos (las mitades son imágenes especulares).
Normal: una distribución simétrica que se amontona en torno a la media y se dispersa en los extremos.
Uniforme (rectangular): cada valor que aparece con igual frecuencia.
Sesgado: una cola se prolonga más que la otra. La dirección de asimetría está en el lado de la cola más larga.
Forma de J: no hay cola al lado de la clase con la frecuencia más alta.
Bimodal: las dos clases más pobladas están separadas por una o más clases. Por lo general, implica que se muestrearon dos poblaciones.
La moda es el valor de los datos que ocurre con mayor frecuencia.
La clase modal es la clase con la frecuencia más alta.
En la distribución binomial no es necesario que las dos frecuencias altas sean iguales.
Polígonos de frecuencias
Una variante del polígono de frecuencias básico es el polígono de frecuencias relativas, que coloca a estas últimas en la escala vertical.
Ojiva
Es una gráfica lineal que representa frecuencias acumulativas, de la misma forma que la distribución de frecuencias acumulativas.
Gráfica de puntos
Es aquella donde se marca cada valor de un datos como un punto a lo largo de una escala de valores. Los puntos que representan valores iguales se apilan.
Gráfica de tallo y hojas
Representa datos que separan cada valor en dos partes: el tallo (el dígito ubicado en el extremo izquierdo) y la hoja (el dígito del extremo derecho).
Gráfica de pareto
Representa datos que separan cada valor en dos partes: el tallo (el dígito ubicado en el extremo izquierdo) y la hoja (el dígito del extremo derecho). Las escalas verticales de las gráficas de Pareto representan tanto frecuencias como frecuencias relativas. La barra más alta se coloca a la izquierda y la más pequeña a la derecha.
Gráfica circular
También se utilizan para datos cualitativos, donde se presentan datos cualitativos como si fueran rebanadas de un pastel. Para construir una gráfica circular, se divide el círculo en las proporciones adecuadas. Aunque la gráfica de Pareto y la circular presenten los mismos datos, la primera es mejor para resaltar los tamaños relativos de los distintos componentes.
Diagrama de dispersión
Es una gráfica de datos apareados (x, y), con un eje x horizontal y un eje y vertical. Los datos se presentan de tal forma que cada valor de un conjunto de datos corresponde a un valor de un segundo conjunto de datos.