Las técnicas estadísticas bivariantes permiten el análisis conjunto de dos características de los individuos
de una población con el propósito de detectar posibles relaciones entre ellas.¿Qué son los datos
bivariantes? Datos bivariantes provienen de la observación simultánea de dos variables (X, Y ) en una
muestra de n individuos. Los datos serán parejas de valores, numéricos o no numéricos, de la forma:
(x1,y1),(x2,y2),...,(xn,yn). Se obtienen de sumar frecuencias conjuntas (absolutas o relativas) por filas y por
columnas.
Coeficiente de regresión
Se denomina coeficiente de regresión a la pendiente (parámetro b) de la recta de regresión de Y sobre
X. Este coeficiente proporciona información sobre el comportamiento de la variable respuesta Y en
función de la variable explicativa X y tiene el mismo signo que la covarianza. a) Si b > 0, al aumentar
los valores de X también aumentan los valores de Y . b) Si b < 0, al aumentar los valores de X, los
valores de Y disminuyen.
Coeficiente de determinación
Una medida para determinar cómo de bueno es el ajuste del modelo es el coeficiente de
determinación (r 2 ) que mide la proporción de variabilidad de Y que explica X a través de la recta de
regresión. El coeficiente de determinación es el cuadrado del coeficiente de correlación lineal, y toma
valores entre 0 y 1. Si r 2 toma valores próximos a 1, esto será indicativo de un buen ajuste. El
coeficiente de determinación del modelo de regresión lineal simple viene dado por: r 2 = S 2 xy s 2 x s 2
y . El coeficiente de determinación, y por tanto, la variabilidad explicada por la recta de regresión de Y
sobre X y la de X sobre Y es el mismo.
Correlación:La correlación es una medida estadística que expresa hasta qué punto dos variables
están relacionadas linealmente (esto es, cambian conjuntamente a una tasa constante). Es una
herramienta común para describir relaciones simples sin hacer afirmaciones sobre causa y efecto.
Tipos de correlación
Correlación directa
se da cuando al aumentar una de las variables la otra aumenta. La recta correspondiente a la nube de
puntos de la distribución es una recta creciente.
Correlación inversa
se da cuando al aumentar una de las variables la otra disminuye.
Correlación nula
La correlación nula se da cuando no hay dependencia de ningún tipo entre las variables. En este caso
se dice que las variables son incorreladas y la nube de puntos tiene una forma redondeada.
Grado de correlación
Correlación fuerte
La correlación será fuerte cuanto más cerca estén los puntos de la recta.
Correlación débil
La correlación será débil cuanto más separados estén los puntos de la recta.
Tipos de variables
Variable dependiente
La variable dependiente es aquella que, dentro de un modelo económico o estadístico, es explicada por
otras variables a las que denominamos independientes. La variable dependiente, en otras palabras, es
aquella cuya variación en su valor viene motivada por fluctuaciones en las variables independientes.
Variable independiente
La variable independiente es aquella que determina el valor de la variable dependiente. Esto, en un
modelo o estudio estadístico. Otra forma de definir la variable independiente, también llamada
explicativa, es aquella cuya variación también causa un cambio en la variable dependiente o variable
explicada.
Tipos de análisis
Modelo de regresión líneal simple
En un modelo de regresión lineal simple tratamos de explicar la relación que existe entre la variable
respuesta Y y una única variable explicativa
Modelo de regresión líneal múltiple
Un modelo de regresión lineal múltiple es un modelo estadístico versátil para evaluar las relaciones
entre un destino continuo y los predictores. Los predictores pueden ser campos continuos, categóricos
o derivados, de modo que las relaciones no lineales también estén soportadas.
Modelo de regresión no lineal
Regresión no lineal es un método para encontrar un modelo no lineal para la relación entre la variable
dependiente y un conjunto de variables independientes.
Diagrama de dispersión
El diagrama de dispersión se usa comúnmente para mostrar cómo dos variables se relacionan entre sí.
De este modo, permite estudiar las relaciones que existen entre dos factores, problemas o causas
relacionadas con la calidad, o un problema de calidad y su posible causa.