En ocasiones es importante comparar dos variables cualitativas, al realizar un estudio con respecto a una población. El registro de los datos asociados a tales variables, permite tener conclusiones importantes, a partir de la muestra seleccionada.
Para la caracterización de dos variables cualitativas se utilizan las tablas de:
Tablas de contingencia
Tablas marginales
Diagrama de barras para dos variables
En una tabla de contingencia lo tabla cruzada, las filas corresponden a las clases de una variable cualitativa, y las columnas corresponden a las clases de la otra variable cualitativa aplicadas a un contexto determinado
La tabla de contingencia también es una tabla de frecuencias porque la información contenida en cada una de las casillas corresponde a la cantidad de personas o individuos que poseen ambas características. Lo que sucede es que en la tabla de contingencia se ofrece una completa distribución de la información, pues permite tener diferentes clases que se pueden establecer para cada una de las variables en estudio.
Pie de foto: : En esta tabla se observa que hay dos variables cualitativas que son: deportes preferidos y género. En las dos clases de variables hay un total. Cada una de las casillas de la tabla contiene la información correspondiente al cruce de las clases de variables.
Tablas de contingencia
Diapositiva 3
Tabla marginal
En la caracterización de dos variables, para cada tabla cruzada se generan dos tablas de contingencia.
A continuación, se preséntala tabla marginal correspondiente al tipo de transporte que usan los estudiantes para ir al colegio
Así, teniendo en cuenta la tabla de porcentajes se puede afirmar que:
De los estudiantes que usan la ruta escolar para ir al colegio, eI 71% son hombres y el 21% son mujeres.
De los estudiantes que vanen transporte público, el 53% son hombres el 47% son mujeres.
De los estudiantes que van caminando al colegio, el 68,1% son hombres y el 31,9% son mujeres.
Pie de foto: : en forma similar, se contribuye la tabla en términos de porcentajes:
Diapositiva 5
características de las variables cuantitativas
Una variable cuantitativa es la que se expresa mediante un número, por tanto se pueden realizar operaciones aritméticas con ella. Podemos distinguir dos tipos:
Variable discreta
Variable continua
Diapositiva 6
Variable discreta
Una variable discreta es aquella que solo puede tomar un número finito de valores entre dos valores cualesquiera de una caraterística.
El número de hermanos de 5 amigos: 2, 1, 0, 1, 3.
Una variable continua es aquella que puede tomar un número infinito de valores entre dos valores cualesquiera de una caraterística.
La altura de los 5 amigos: 1.73, 1.82, 1.77, 1.69, 1.75.
En la práctica medimos la altura con dos decimales, pero también se podría dar con tres decimales.
EJEMPLO:
Ingreso, talla, peso, etc.
Diapositiva 8
Diagrama de tallo y hoja
Los diagramas de tallo y hojas se utilizan para analizar y exponer datos al mismo tiempo. Es una forma de relacionar los datos con otras variables.
Para hacer un diagrama de tallo y hojas, debes crear el "tallo" escribiendo los dígitos que representen los valores posicionales más grandes a la izquierda de una línea vertical. A la derecha, escribe los dígitos que sobren para crear las "hojas." Sí, suena abstracto.
EJEMPLOS:
Horarios de trenes
Edad de 20 personas
Comparar dos distribuciones
La distribución de frecuencias o tabla de frecuencias es una ordenación en forma de tabla de los datos estadísticos, asignando a cada dato su frecuencia correspondiente.
TIPOS DE FRECUENCIA:
Frecuencia absoluta
Frecuencia relativa
Frecuencia acumulada
Frecuencia relativa acumulada
tablas de distribución de frecuencias
Diapositiva 10
Frecuencia absoluta
La frecuencia absoluta es el número de veces que aparece un determinado valor en un estudio estadístico.
Se representa por fi.
La suma de las frecuencias absolutas es igual al número total de datos, que se representa por N.
Pie de foto: : Para indicar resumidamente estas sumas se utiliza la letra griega Σ (sigma mayúscula) que se lee suma o sumatoria.
Diapositiva 12
Frecuencia relativa
el resultado de dividir la frecuencia absoluta de un determinado valor entre el número total de datos, se representa por ni . La suma de la frecuencias relativas es igual a 1. Lo cual puede verse fácilmente si se factoriza N.
La frecuencia acumulada es la suma de las frecuencias absolutas de todos los valores inferiores o iguales al valor considerado.
La frecuencia acumulada se representa por Fi.
Pie de foto: : Por ejemplo, en una encuesta, se preguntó a 10 personas acerca del número de mascotas que tenían y en la siguiente tabla se muestra cómo calcular la frecuencia acumulativa:
Diapositiva 14
La frecuencia relativa acumulada es el cociente entre la frecuencia acumulada de un determinado valor y el número total de datos.
Se representa por Ni.
Se puede expresar en tantos por ciento.
El denominado gráfico de puntos permite mostrar apropiadamente a pequeños conjuntos de datos y tiene la gran ventaja de ser fácilmente construido a mano.
En este tipo de gráfico, la abcisa representa los valores de la variable estudiada y la ordenada la frecuencia de aparición de un valor en el conjunto de datos estudiado.
Comentario pedagógico.
Para la construcción de un gráfico de puntos, es necesario que el alumno conozca la representación de puntos en una recta graduada.
Pie de foto: : Se puede ver con facilidad la distribución de los valores observados y describir la información contenida en ellos.
Diapositiva 18
Histogramas
Un histograma es una representación gráfica de datos agrupados mediante intervalos. Los datos provienen de una variable cuantitativa continuas. Gracias a él puedes hacerte rápidamente una idea de la distribución de los datos o muestra.
También cabe emplear variables cualitativas ordinales, siendo necesario que el número de datos sea alto.
Un histograma es un conjunto de rectángulos que representan las frecuencias absolutas de cada uno de los intervalos. Los intervalos abarcan todo el conjunto sin cortarse, de manera que un elemento está solo en un intervalo.
Es una gráfica lineal que representa las frecuencias acumulativas.
La ojiva utiliza fronteras de clase, a lo largo de la escala horizontal y que la gráfica comienza con la frontera inferior de la primera clase y finaliza con la frontera superior de la última clase.
Las medidas de localización dividen la distribución en pares iguales, sirven para clasificar a un individuo o elemento dentro de una determinada población o muestra.
Diapositiva 21
ClasificaciónMedia: X = Σ xi
nMediana: Pares 12345678 → 4+5
2
Impares 1234567 → 4Moda: Dato que más se repite, puede ser de 3 formas:
Modales: números que se repiten una sola vez → 1223456789
Bimodales: números que se repiten dos veces → 12233456789
Multimodales: números que se repiten más de dos veces →1223344556789
Amodales: Los números no tienes repeticiones → 123456789
Percentiles: Los percentiles son los 99 valores que dividen la serie de datos en 100 partes iguales.
i = P . n
100
Deciles: Deciles son los 9 valores que dividen la serie de datos en 10 partes iguales.
i = P . n
10
Cuartiles: Son los 3 valores de la variable que dividen a un conjunto de datos ordenados en cuatro partes iguales. Q1, Q2, Q3 determinan los valores correspondientes al 25%, 50% y 75% de los datos.
Q1 = 25 . n
100
Diapositiva 22
Las medidas de variabilidad nos informan sobre el grado de concentración o dispersión que presentan los datos respecto a su promedio. Llamaremos homogénea, concentrada o poco dispersa a aquella distribución en la que todos los datos están cercanos al centro, como 4 4 5 5 5 5 6 6 6 6 7, y heterogénea o dispersa a la distribución con datos más separados del centro, como 1 3 5 8 10 16 20.
Entre las diversas formas que hay para medir la varianza o dispersion de datos se haya el rango, el cual es llamado Recorrido o Amplitud total, es la diferencia entre el máximo valor del conjunto de datos y el mínimo de ellos. A mayor rango, mayor dispersión. Es la medida de variabilidad más fácil de calcular. Para datos finitos o sin agrupar, el rango se define como la diferencia entre el valor más alto (Xn ó Xmax.) y el mas bajo (X1 ó Xmin) en un conjunto de datos. Rango para datos no agrupados; R = Xmáx.-Xmín = Xn-X1
- Rango y Desviación media
La desviación respecto a la media es la diferencia entre cada valor de la variable estadística y la media aritmética. Di = x - x La desviación media es la media aritmética de los valores absolutos de las desviaciones respecto a la media.
Diapositiva 24
Varianza y Desviación típica
Es una medida muy sensible de la variabilidad y base de muchas técnicas estadísticas.
Junto con la media forma el conjunto más importante de medidas.
Es propia de las medidas de intervalo o razón. Su inconveniente es que no usa la misma unidad que los datos, sino su cuadrado.
No se deben comparar varianzas en conjuntos de unidades muy distintas, como estatura e inteligencia.
En teoría del muestreo se sustituye por la cuasi-varianza, de idéntica fórmula, pero con cociente N-1 en lugar de N. En este caso no sería válida la segunda fórmula.
Es la raíz cuadrada de la anterior. Su objeto es conseguir medir la variabilidad en las mismas unidades que los datos. Así, un conjunto medido en metros, tendrá la varianza medida en metros cuadrados, pero la desviación típica en metros.
Como en la varianza, para datos aislados basta con suprimir las frecuencias ni.
La desviación típica s es base de muchas técnicas, al igual que la media y la varianza. Su gran ventaja es estar medida en las mismas unidades que los datos y la media, lo que permite establecer razones y proporciones entre ellas.
La desviación típica cumple la llamada desigualdad de Tchebychev: según la cual, los datos que se alejan de la media una distancia igual o menor que s, multiplicado por un coeficiente k suponen más de la proporción 1-1/k2. Así, el 75% de los datos al menos, se encuentra a menos de dos desviaciones típicas y el 89% a menos de tres.
Los tipos de muestra estadísticas hacen alusión a un fragmento o porcion que resulte representativa de un determinado conjunto de elementos. que permite sacar conclusiones sobre los rasgos y característica del universo o población total.
Clases de muestra
Diapositiva 27
Muestreo de conveniencia
También conocido bajo el nombre de muestra por selección, es aquella en la que se eligen casos particulares intentando que estos sean los más representativos posible del universo.
Ejemplo: en este caso un encuestador se encarga de elegir al azar a personas que encuentren en algún punto especifico ,como puede ser una esquina o la puerta de un shopping, y allí hacerle una serie de preguntas .lo que puede ocurrir es que el encuestador se guie por la apariencia física de las personas, antes de acercársele a hacerle las preguntas correspondientes.
En esta todos los elementos que integran el universo tienen exactamente la misma probabilidad de ser elegidos para conformarla. Existen distintas variantes:
Muestra aleatoria simple
Muestra sistemática
Muestra aleatoria simple
Para conformar este tipo de muestra se confecciona un listado en el que figura todos los elemento que le integran.
Muestra aleatorio por conglomerados:
Para conformar esta clase de muestra , lo que hace el investigador es dividir al universo en distintos grupos.
Muestra mixta
Son aquellos universos que son sumamente complejo y por tanto resulta dificil confeccionar una muestra que sea representativa.
Muestra sistemática
En esta muestra solo se elige alazar el primer elemento. Para luego elegir en base a esta elección al resto en intervalos regulares esto significa que se sistematiza la elección de los elemento que conformaran a la muestra.
Muestra aleatoria estratificada:
En este caso también se eligen de manera aleatoria. la diferencia de esta variante es que previamente el universo se divide en grupo
Diapositiva 31
“Si un suceso se puede realizar de “m” formas diferentes y luego se puede realizar otro suceso de “n” formas diferentes, el número total de formas en que pueden ocurrir es igual a m x n”. Es decir, ambos eventos se realizan, primero uno y luego el otro. El “y” indica multiplicación.
Ejemplo: ¿de cuántas formas se puede vestir una persona que tiene 3 pantalones y 3 camisas?
Para vestirse, la persona se pone el pantalón y luego la camisa, es decir tiene 3 x 3 = 9 opciones diferentes de vestirse.
Se llama permutaciones de m elementos (m = n) a las diferentes agrupaciones de esos m elementos de forma que:
Sí entran todos los elementos.
Sí importa el orden.
No se repiten los elementos.
En todo problema combinatorio hay varios conceptos claves que debemos distinguir:
Población:Es el conjunto de elementos que estamos estudiando. Denominaremos con m al número de elementos de este conjunto.
Muestra: Es un subconjunto de la población. Denominaremos con n al número de elementos que componen la muestra.
Los diferentes tipos de muestra vienen determinados por dos aspectos:
Orden: Es decir, si es importante que los elementos de la muestra aparezcan ordenados o no.
Repetición: La posibilidad de repetición o no de los elementos.
Combinatoria
Diapositiva 34
Muestras con repetición:
Dado un experimento aleatorio, se dice que la muestra tiene repetición cuando para formarla se puede usar varias veces el mismo elemento de la población.
Muestras ordenadas:
Se dice que la muestra es ordenada si al conformarla es importante el orden en que se ubique el orden de la población
Espacio Muestral
Se llama espacio muestral (Ω) asociado a un experimento aleatorio, el conjunto de todos los resultados posibles de dicho experimento.
Evento
Se llama evento o suceso a todo subconjunto de un espacio muestral.
Por ejemplo en el espacio muestral
Ω= {1, 2, 3, 4, 5, 6}
Pie de foto: : Que de un modo resumido, se puede expresar como:
Diapositiva 36
Bibliorafía
Juliana Bejarano. (2013 ). CARACTERIZACIÓN DE VARIABLES CUALITATIVAS. 7/07/2017, de Ciencia y Saber Siglo XXI Sitio web: características de dos variables cualitativas. (2013). CARACTERIZACIÓN DE VARIABLES CUALITATIVAS. 7/07/2017, de Ciencia y saber Siglo XXI Sitio web: https://cienciaysabersigloxxi.wordpress.com/2013/05/03/caracterizacion-de-variables-cualitativas/
Anónimo . (2014). Tablas de contingencia. 7/07/2017, de Vitutor Sitio web: http://www.vitutor.com/pro/2/a_14.html
Anónimo. (2013). tablas marginales. 7/07/2017, de wordpress Sitio web: https://mariapaog.wordpress.com/estadistica/tercer-periodo/tablas-marginales/
Universo Formulas. (2014). DIAGRAMA DE TALLO Y HOJAS. 7/07/2017, de Universo Formulas Sitio web: http://www.universoformulas.com/estadistica/descriptiva/diagrama-tallo-hojas/
Universo Formulas. (2016). TABLA DE FRECUENCIAS. 7/07/2017, de Universo Formulas Sitio web: http://www.universoformulas.com/estadistica/descriptiva/tabla-frecuencia
Universidad Nacional Autónoma de México. (2014). GRÁFICA DE PUNTOS . 7/07/2017, de UNAM Sitio web: http://asesorias.cuautitlan2.unam.mx/Laboratoriovirtualdeestadistica/DOCUMENTOS/TEMA%201/8.GRAFICA%20DE%20PUNTOS.pdf
Universo Formulas. (2014). HISTOGRAMA. 7/07/2017, de Universo Formulas Sitio web: http://www.universoformulas.com/estadistica/descriptiva/histograma/
Diapositiva 37
Bibliografía
Anónimo . (2015). Ojiva de frecuencias. 7/07/2017, de Wordpress Sitio web: https://estadisticadual.wordpress.com/2015/10/07/ojiva-de-frecuencias-absolutas/
Anónimo . (2013 ). MEDIDAS DE VARIABILIDAD. 7/07/2017, de Estadística Descriptiva Sitio web: https://sites.google.com/site/estadisticadescriptivaenedu/home/unidad-1/medidas-de-variabilidad
Monik Romero A.. (2012). Medidas de Localización. 7/07/2017, de Blog Sitio web: http://estadistica-deskriptive-mr.blogspot.com.co/2012/06/medidas-de-localizacion.html
Anónimo . (2014). Tipos de muestreo. 7/07/2017, de Vitutor Sitio web: http://www.vitutor.com/estadistica/inferencia/inferenciaContenidos.html
Anónimo . (2013). Principio de multiplicación. 7/07/2017, de CubaEduca Sitio web: http://matematica.cubaeduca.cu/medias/interactividades/temas_12mo/1.2.1_Principio_%20multiplicativo/co/Principio_multiplicativo_3.html
Anónimo . (2015). Permutaciones. 7/07/2017, de Vitutor Sitio web: http://www.vitutor.com/pro/1/a_4.html
Anónimo . (2013). Combinatoria. 7/07/2017, de Vitutor Sitio web: http://www.vitutor.com/pro/1/a_1.html
Luis Jacobo. (2010). Probabilidad de conteo . 7/07/2017, de Bolg Sitio web: http://probabilidadestadistic.blogspot.com.co/2010/09/tecnicas-de-conteo.html