Created by Guillermo Quiñones
almost 11 years ago
|
||
En el tema se presentó la regresión lineal simple y se mostró su uso en la obtención de una ecuación de regresión estimada que describe la relación entre dos variables. Recuérdese que la variable que se predice o explica es la variable dependiente y la variable que se usa para predecir o explicar la variable dependiente es la variable independiente. En este tema se continúa con el estudio del análisis de regresión considerando, ahora, las situaciones en las que intervienen dos o más variables independientes. Este estudio, al que se le conoce como análisis de regresión múltiple, permite tomar más factores en consideración y obtener estimaciones mejores que las que son posibles con la regresión lineal simple.Modelo de regresión múltiple El análisis de regresión múltiple estudia la relación de una variable dependiente con dos o más variables independientes. Para denotar el número de variables independientes se suele usar p.Modelo de regresión y ecuación de regresión Los conceptos de modelo de regresión y ecuación de regresión vistos en el tema previo, son aplicables en el caso de la regresión múltiple. A la ecuación que describe cómo está relacionada la variable dependiente y con las variables independientes x1, x2, . . ., xp se le conoce como modelo de regresión múltiple. Se supone que el modelo de regresión múltiple toma la forma siguiente
Ecuación de regresión múltiple estimada Si se conocieran los valores de B0, B1, B2, . . . , Bp, se podría usar la ecuación de regresion multiple para calcular la media de las y para valores dados de x1, x2, . . ., xp. Desafortudamente, los valores de estos parámetros no suelen conocerse, es necesario estimarlos a partir de datos muestrales. Para calcular los valores de los estadísticos muestrales b1, b2, . . ., bp, que se usan como estimadores puntuales de los parámetros B0, B1, B2, . . . , Bp se emplea una muestra aleatoria simple. Con los estadísticos muestrales se obtiene la siguiente ecuación de regresión múltiple estimada.
En el tema anterior, se usó el método de mínimos cuadrados para obtener la ecuación de regresión estimada que permitía aproximar mejor la relación lineal entre las variables dependiente e independiente. Este método también se usa para obtener la ecuación de regresión múltiple estimada. El criterio en el método de mínimos cuadrados, como ya se dijo, es el siguiente.
Los valores estimados de la variable dependiente se calculan empleando la ecuación de regresión múltiple estimada
Los valores estimados de la variable dependiente se calculan empleando la ecuación de regresión múltiple estimada.Como indica la expresión, el método de mínimos cuadrados emplea datos muestrales para obtener los valores de b0, b1, b2, . . ., bp que hacen que la suma de los cuadrados de los residuales [las diferencias entre los valores observados de la variable dependiente (yi) y los valores estimados de la variable dependiente (yi )] sea un mínimo. En el tema se dieron las fórmulas para calcular los estimadores b0 y b1 para la ecuación de regresión lineal simple estimada y= b0 + b1x empleando el método de mínimos cuadrados. Con conjuntos de datos relativamente pequeños, fue posible usar esas fórmulas para obtener b0 y b1 mediante cálculos manuales. En la regresión múltiple, en cambio, las fórmulas para calcular b0, b1, b2, . . . , bp emplean álgebra de matrices y quedan fuera del alcance de este texto. Por esta razón, en el estudio de la regresión múltiple, se centrará la atención en el uso de los paquetes de software para obtener la ecuación de regresión estimada y algunas otras informaciones. Lo importante será la interpretación de los resultados que proporcionan estos paquetes de software y no cómo hacer los cálculos para la regresión múltiple.Un ejemplo: Butler Trucking Company Para ilustrar el análisis de regresión múltiple, se empleará un problema de la empresa Butler Trucking Company, una empresa que se dedica al transporte de objetos y mercancías en el sur de California. La actividad principal de esta empresa es hacer entregas en su área local. Para mejorar el horario de trabajo, los gerentes deseaban estimar el tiempo total de recorrido diario necesario para hacer las entregas. Al principio, los gerentes creyeron que el tiempo total de recorrido diario estaba estrechamente relacionado con el número de millas recorridas para hacer las entregas. Partiendo de una muestra aleatoria simple de 10 entregas se obtuvieron los datos que se presentan en la tabla siguiente y en el diagrama de dispersión de la figura siguiente. Después de observar el diagrama de dispersión, los gerentes consideraron que para describir la relación entre tiempo total de recorrido (yi) y el número de millas recorridas (xi) podía emplearse el modelo de regresión lineal simple
La ecuacion lineal estimada para con esas variables de de la siguiente manera:y= 1.27+0.0678x1Los gerentes desean considerar otra variable independiente más para explicar parte de la variabilidad restante de la variable dependiente. Al tratar de encontrar otra variable independiente los gerentes encontraron que el número de entregas podía contribuir también a la duración total del recorrido. En la tabla siguiente se presentan los datos de Butler Trucking después de agregar el número de entregas.
La ecuación de regresión estimada es
Nota sobre la interpretación de los coeficientes En este punto es útil hacer una observación sobre la relación entre la ecuación de regresión estimada en la que la única variable independiente es el número de millas recorridas y la ecuación en la que, como segunda variable independiente, se incluye el número de entregas. El valor de b1 no es igual en ambos casos. En la regresión lineal simple, b1 se interpreta como una estimación del cambio en y debido al cambio en una unidad de la variable independiente. En el análisis de regresión múltiple, esta interpretación cambia ligeramente. Es decir, en el análisis de regresión múltiple, cada uno de los coeficientes de regresión se interpreta como sigue: bi representa la estimación del cambio en y debido a un cambio en una unidad en xi mientras todas las demás variables independientes permanecen constantes. En el ejemplo de Butler Trucking con dos variables independientes,b1 = 0.0611. Por lo tanto, 0.0611 horas es la estimación del aumen-
Con conjuntos de datos relativamente pequeños, fue posible usar esas fórmulas para obtener b0 y b1 mediante cálculos manuales. En la regresión múltiple, en cambio, las fórmulas para calcular b0, b1, b2, . . . , bp emplean álgebra de matrices y quedan fuera del alcance de este texto. Por esta razón, en el estudio de la regresión múltiple, se centrará la atención en el uso de los paquetes de software para obtener la ecuación de regresión estimada y algunas otras informaciones.Un ejemplo: Butler Trucking CompanyPara ilustrar el análisis de regresión múltiple, se empleará un problema de la empresa Butler Trucking Company, una empresa que se dedica al transporte de objetos y mercancías en el sur de California. La actividad principal de esta empresa es hacer entregas en su área local. Para mejorar el horario de trabajo, los gerentes deseaban estimar el tiempo total de recorrido diario necesario para hacer las entregas.Al principio, los gerentes creyeron que el tiempo total de recorrido diario estaba estrechamente relacionado con el número de millas recorridas para hacer las entregas. Partiendo de una muestra aleatoria simple de 10 entregas se obtuvieron los datos que se presentan en la tabla siguiente y en el diagrama de dispersión de la figura siguiente. Después de observar el diagrama de dispersión, los gerentes consideraron que para describir la relación entre tiempo total de recorrido (yi) y el número de millas recorridas (xi) podía emplearse el modelo de regresión lineal simple Y=B0+B1x1+E Para estimar los parámetros B0 y B1 e empleó el método de mínimos cuadrados obteniéndose la ecuación de regresión estimada
Este descubrimiento es bastante satisfactorio, sin embargo, los gerentes deseban considerar otra variable independiente más para explicar parte de la variabilidad restante de la variable dependiente.Al tratar de encontrar otra variable independiente los gerentes encontraron que el número de entregas podía contribuir también a la duración total del recorrido. En la tabla siguiente se presentan los datos de Butler Trucking después de agregar el número de entregas.
En este apéndice se describe el uso de la herramienta de regresión de Excel para obtener la ecuación de regresión estimada para el problema de Butler Trucking. A medida que se describen los pasos a seguir consúltese la figura siguiente. Primero, en las celdas A1:D1 de la hoja de cálculo se ingresan los rótulos Recorrido, Millas, Entregas y Tiempo, y en las celdas B2:D11 se ingresan los datos muestrales. En las celdas A2:A11, los números 1-10 sirven para identificar cada observación.Los pasos siguientes describen cómo emplear la herramienta de regresión para el análisis de regresión múltiple. Seleccionar el menú Herramientas Elegir Análisis de datos Elegir Regresión en la lista Funciones para análisis Cuando aparezca el cuadro de diálogo Regresión Ingresar D1:D11 en el cuadro Rango Y de entrada Ingresar B1:C11 en el cuadro Rango X de entrada Seleccionar Rótulos Seleccionar Nivel de confianza Ingresar 99 en el cuadro Nivel de confianza Seleccionar Rango de salida Ingresar A13 en el cuadro Rango de salida (para identificar la esquina superior izquierda de la de la hoja de cálculo en donde aparecerán los resultados) Clic en Aceptar En los resultados de Excel que se presentan en la figura, el rótulo para la variable independiente x1 es Millas (ver celda A30) y el rótulo para la variable independiente x2 es Entregas (ver celda A31). La ecuación de regresión estimada es
Introduccion
Método de mínimos cuadrados
Método de mínimos cuadrados 2
Videos
Want to create your own Notes for free with GoConqr? Learn more.