Busca establecer una ecuación que permita
estimar el valor desconocido de una variable a
partir del valor conocido de una o más
variables.
El término regresión fue utilizado por primera vez por
el genetista y estadístico inglés Francis Galton en 1877
Es el proceso general de predecir una variable (Y)
a partir de otra (X). Y estas variables pueden ser:
Dependientes
Independientes
Mientras que sus
relaciónes pueden
ser:
Inversas
La pendiente de esta línea es negativa, por
que a medida que aumenta el valor de la
variable Y, el valor de la variable X disminuye.
Directas
La pendiente de esta línea es positiva,
por que la variable Y crece a medida que
la variable X también lo hace.
Estas se pueden
representar
gráficamente
mediante un
Diagrama de Dispersión
Consta de una dispersión de puntos tal que cada
punto representa un valor de la variable
independiente , y un valor asociado de la
variable dependiente
Se pueden determinar los patrones que indican como las
variables están relacionadas y si existe una relación entre ellas
visualizando la clase de línea o ecuación de estimación que
describe a dicha relación
Método de mínimos cuadrados
El método de mínimos cuadrados sirve para
determinar la recta que mejor se ajuste a los datos
muestrales, y los supuestos de este método son:
El error es cero. Los datos obtenidos de las muestra
son estadísticamente independientes. La varianza del
error es igual para todos los valores de X.
Correlación lineal
Una técnica estadística que establece un índice
que proporciona, en un solo número, una
medida de la fuerza de asociación entre dos
variables de interés
El análisis de correlación es la herramienta estadística de que nos
valemos para describir el grado de relación que hay entre dos variables.
Existen dos medidas para describir la correlación
entre dos variables:
Coeficiente de determinación
Es la manera primaria de medir el grado, o fuerza, de la
relación que existe entre dos variables, X y Y.
Se representa como r 2 , y mide exclusivamente la
fuerza de una relación lineal entre dos variables.
LIZBETH FLORES GUTIÉRREZ
1201553
Interpretaciones
Coeficiente de correlación.
Es la segunda medida con
que puede describirse la
eficacia con que una
variable es explicada por
otra, así pues el signo de r
indica la dirección de la
relación entre las dos
variables X y Y.
Diagramas de dispersión con correlación débil y fuerte