ANÁLISIS DE DATOS UNIDIMENSIONALES

Description

Mind Map on ANÁLISIS DE DATOS UNIDIMENSIONALES, created by nidia yaneth suaez gomes on 30/10/2019.
nidia yaneth suaez gomes
Mind Map by nidia yaneth suaez gomes, updated more than 1 year ago
nidia yaneth suaez gomes
Created by nidia yaneth suaez gomes over 4 years ago
316
0

Resource summary

ANÁLISIS DE DATOS UNIDIMENSIONALES
  1. MEDIDAS DE POSICIÓN
    1. En general, las medidas de posición indican un valor de la variable en torno al cual se sitúan un grupo de observaciones.
      1. Puede distinguirse entre
        1. Medidas de tendencia central
          1. Media aritmética
            1. Es la suma de todos los valores de la variable divididos por el número total de observaciones.
              1. esta medida sólo se puede calcular si la variable estadística objeto de estudio es de naturaleza cuantitativa.
                1. El valor que toma la media debe estar siempre incluido entre el valor mínimo y máximo del dominio de la variable analizada.
                2. Media armónica
                  1. La media armónica, que se denota por Mh
                    1. se define como
                      1. distribución de frecuencia de valores sin agrupar
                        1. frecuencias unitarias
                          1. numero impar de observaciones
                            1. numero par de observaciones
                            2. frecuencias no unitarias
                      2. Media geometrica
                        1. Que es empleada cuando las variables son de naturaleza multiplicativa en el sentido
                          1. se denota por Mg
                            1. la hora de calcular la media geométrica suele utilizarse que el logaritmo de la media geométrica que es igual a la media aritmética de los logaritmos de los valores de la variable
                            2. Mediana
                              1. que se denota por Me, es un valor del recorrido de la variable que deja el mismo número de observaciones a su izquierda y a su derecha.
                                1. Distribuciones de frecuencias de valores sin agrupar
                                  1. Al trabajar con valores sin agrupar hay que considerar varias posibles situaciones
                                    1. Situación 1
                                      1. Distribución de frecuencias unitarias
                                      2. Situación 2.
                                        1. Distribución de frecuencias no unitarias
                                    2. Distribuciones de frecuencias agrupadas
                                      1. Este caso tiene menos interés, pues actualmente no se suele trabajar con datos agrupados, dado que la informática permite manejar mucha información sin necesidad de perder parte de ella en agrupaciones.
                                  2. Moda
                                    1. La moda de una distribución, a la que se denotará por Mo, representa el valor de la variable con mayor frecuencia. No tiene por qué ser única.
                                      1. si hay dos o más valores de la variable que tienen la misma frecuencia, siendo esta la mayor, se estará ante una distribución multimodal (bimodal, dos modas; trimodal, tres modas; etc.).
                                        1. Del mismo modo que se procedió con la mediana, para determinar la moda debe distinguirse entre distribuciones de valores sin agrupar y agrupados.
                                          1. Distribuciones de frecuencias de valores sin agrupar
                                            1. En este caso, y según la definición de la moda, hay que fijarse en cuál es el valor de la variable que más se repite, el de mayor frecuencia.
                                            2. Distribuciones de frecuencias de valores agrupados
                                              1. Cuando se trabaja con valores agrupados en intervalos, lo más sencillo para determinar el valor modal consiste en dibujar el histograma.
                                          2. Medidas de tendencia no central
                                            1. Cuantiles
                                              1. Las familias de cuantiles más utilizadas son aquellas que dividen la distribución de frecuencias en cuatro, diez y cien partes.
                                                1. Cuartiles (k = 4):
                                                  1. son tres valores (Cs, s = 1, 2, 3) del recorrido que dividen la distribución en 4 partes, conteniendo cada una de ellas el 25% de las observaciones.
                                                  2. Deciles (k = 10):
                                                    1. son nueve valores del recorrido (Ds, s = 1, 2, …, 9) que dividen la distribución en 10 partes, de tal forma que cada una de ellas contendrá el 10% de las observaciones.
                                                    2. Percentiles (k = 100):
                                                      1. son noventa y nueve valores del recorrido (Ps, s = 1, 2, …, 99) que dividen la distribución en 100 partes, conteniendo cada una de ellas el 1% de las observaciones.
                                          3. MEDIDAS DE DISPERSIÓN
                                            1. El término dispersión o variabilidad hace referencia a cómo de distantes, de separados, se encuentran los datos.
                                              1. Rango
                                                1. es la diferencia entre el valor máximo y mínimo, es decir, Re = xmax − xmin. La principal desventaja de este tipo de medida de dispersión es que únicamente tiene en cuenta dos valores de la variable.
                                                2. Varianza
                                                  1. que se denota por S2X, se define como la media aritmética de los cuadrados de las diferencias de los valores de la variable a la media aritmética
                                                    1. pretende medir la dispersión que presentan los valores de la variable respecto de su media. Cuanto mayor sea la varianza, cuanto mayor sea la dispersión, menos representativa resultará ser la media.
                                                    2. Desviación típica
                                                      1. es una medida de dispersión que suele proporcionarse junto con la media de la distribución, puesto que ambas magnitudes vienen expresadas en la misma unidad de medida, lo que facilita enormemente la interpretación de los resultados.
                                                      2. Coeficiente de variación de Pearson
                                                        1. Es el cociente entre la desviación típica y la media aritmética de la variable estadística X. Suele representarse por g0(X).
                                                          1. es una medida de dispersión relativa. Por esta razón, se utiliza para comparar la dispersión entre dos o más distribuciones, independientemente del valor de sus medias y de la unidad de medida de las variables.
                                                      3. MOMENTOS
                                                        1. A partir de la distribución de frecuencias es posible calcular una serie de valores específicos que la caracterizan. Estos valores son los denominados momentos.
                                                          1. Momentos ordinarios o respecto al origen
                                                            1. Dada una variable estadística unidimensional (X) y su distribución de frecuencias, se define el momento ordinario (o respecto al origen) de orden p, que se denota por ap(X)
                                                            2. Momentos centrales o respecto a la media
                                                              1. Dada una variable estadística unidimensional (X) y su distribución de frecuencias, se define el momento central (o respecto a la media) de orden p, que se denota por mp(X)
                                                              2. Relación entre los momentos ordinarios y centrales
                                                                1. Es posible expresar cualquier momento central en función de los momentos ordinarios.
                                                            3. MEDIDAS DE FORMA
                                                              1. En este apartado se va a comparar una determinada distribución de frecuencias con un modelo ideal, la distribución Normal (que tiene forma de campana). La comparación se centrará, básicamente, en dos aspectos fundamentales.
                                                                1. Medidas de asimetría
                                                                  1. Para medir la asimetría de una distribución pueden utilizarse diferentes coeficientes, aunque es frecuente obtener el denominado coeficiente de asimetría (de Fisher), que se denota por g1, y se define como el cociente entre el momento central de orden 3 y la desviación típica elevada al cubo.
                                                                  2. Medidas de apuntamiento (curtosis)
                                                                    1. Las medidas de apuntamiento analizan si una distribución de frecuencias es más apuntada o menos al comparar ésta con una distribución tipo, la distribución Normal con su misma media y varianza.
                                                                2. TRANSFORMACIONES LINEALES Y TIPIFICACIÓN DE VARIABLES
                                                                  1. Supóngase que, en principio, se está trabajando con la distribución de frecuencias de una variable estadística X, de la que se ha obtenido una serie de estadísticos (media, varianza, etc,) y que por cualquier circunstancia es necesario pasar a trabajar con otra variable estadística Y, que se obtiene a partir de la anterior como resultado de:
                                                                    1. Sumar (o restar) una constante a a todos los valores de la variable estadística X, es decir, de efectuar sobre ésta un cambio de origen: Y = X + a o Y = X - a.
                                                                      1. Multiplicar (o dividir) por una constante b todos los valores de la variable X, es decir, de realizar sobre X un cambio de unidad (o escala): Y = b · X o .
                                                                        1. Practicar sobre la variable X tanto un cambio de unidad como de origen, por ejemplo: Y = b · X + a.
                                                                      2. MEDIDAS DE CONCENTRACIÓN: CURVA DE LORENZ E ÍNDICE DE GINI
                                                                        1. Las medidas de concentración, que no se deben confundir como opuestas a las medidas de dispersión, indican el mayor o menor grado de igualdad en el reparto total de los valores de la variable objeto de estudio.
                                                                          1. La concentración puede determinarse gráficamente a través de la curva de Lorenz. Una medida analítica para la concentración es el conocido como índice de Gini.
                                                                          2. Curva de Lorenz
                                                                            1. se relaciona el porcentaje acumulado de frecuencias (pi)—hogares, familias, individuos, trabajadores, industrias, etc.—,
                                                                            2. Índice de Gini
                                                                              1. que se denota por IG, es aproximadamente el cociente entre el área comprendida entre la bisectriz del primer cuadrante y la curva de Lorenz y el triángulo
                                                                              2. Haciendo operativo el índice de Gini y la curva de Lorenz
                                                                                1. es necesario calcular los porcentajes acumulados de individuos y del volumen total de Para ello, lo más práctico consiste en añadir columnas a la tabla de frecuencias original
                                                                              Show full summary Hide full summary

                                                                              Similar

                                                                              Computer Science
                                                                              jacobhuntergoddard
                                                                              Mga Sanhi at Epekto ng Ikalawang Digmaang Pandaigdig
                                                                              Darwin Tesion
                                                                              A2 Geography- Energy Security
                                                                              sophielee0909
                                                                              An Inspector Calls - Themes
                                                                              mhancoc3
                                                                              Causes, Practices, and Effects of World War 1
                                                                              Emma Pettersen
                                                                              Changing Urban Environments
                                                                              John Ditchburn
                                                                              Biology B1
                                                                              Chloe Winn
                                                                              Biology B3
                                                                              James Burns
                                                                              Examen II Salesforce Developer
                                                                              Youssef Ahmani
                                                                              20 Question Linguistics Vocabulary Quiz
                                                                              chernov23432