La serie de datos, se ve afectada por valores altos y bajos, así como también por las respectivas frecuencias.
Para datos agrupados
En este caso los cuartiles se buscará la primera clase cuya frecuencia acumulada supere N/4, 2N/4 o 3N/4 de las observaciones, según estemos hallando el primer, segundo o tercer cuartil. La marca de clase de dicho intervalo, se podría dar como una aproximación de la mediana. Sin embargo podemos obtener un valor más aproximado empleando la fórmula siguiente, similar a la empleada para hallar la mediana.
busca determinar el valor que tiene aquella observación que divide la cantidad de observaciones en dos mitades iguales.
La moda, es aquel dato, aquel valor de la variable que más se repite
Los cuartiles dividen la serie de datos en cuatro partes iguales. Se calculan tres cuartiles: Q1, Q2 y Q3Los cuartiles dividen la serie de datos en cuatro partes iguales. Se calculan tres cuartiles: Q1, Q2 y Q3
Los percentiles son los valores de la variable que dividen a un conjunto de datos ordenados en cien partes iguales. 100 21... , P PP determinan los valores correspondientes al 1%, 2%...100% de los datos. 50 P coincide con la mediana.
Es la diferencia entre el mayor y el menor de los valores que toma la variable
También se definen el rango de un conjunto de números es la diferencia entre el mayor y el menor de todos ellos.
Mientras mayor es la desviación estándar, mayor es la dispersión de la población. La desviación estándar es un promedio de las desviaciones individuales de cada observación con respecto a la media de una distribución
La desviación media es una medida de dispersión, una medida de cómo los valores individuales del conjunto pueden diferir de la media. El valor absoluto se usa para evitar que las desviaciones de signo contrario se cancelan mutuamente.
cuando se desea hacer referencia a la relación entre el tamaño de la media y la variabilidad de la variable, se utiliza el coeficiente de variación
Es que sus unidades de medición se encuentran al cuadrado, por lo que no se puede comparar con la media aritmética. Debido a esto, se define la Desviación Estándar como la raíz cuadrada de la varianza
Se define como el promedio de las desviaciones cuadráticas respecto a su misma media. Toma como referencia para el análisis de la variabilidad, el promedio o media de la variable.
La varianza es la suma de los cuadrados de las diferencias de los datos con relación a su media aritmética, dividida entre el tamaño de la muestra menos 1.
agrupado
varianza
. Se identifica con ̅x, M(X) o también con la letra µ.
Si tenemos n datos, para hallar el primer cuartil, se ordenan los valores de menor a mayor y a continuación se busca en dicha serie ordenada el primer valor cuyo orden de lugar supere n/4.
Puede ocurrir que el valor coincida exactamente con n/4 (sucede cuando n es múltiplo de 4), en tal caso, el primer cuartil se obtiene tomando dicha observación y la siguiente, y calculando su media aritmética, tal y como hacíamos para la mediana.
El Coeficiente de variación (CV) es una medida de la dispersión relativa de un conjunto de datos, que se obtiene dividiendo la desviación estándar del conjunto entre su media aritmética y se expresa generalmente en términos porcentuales.