Sesgo por variable omitida: El sesgo por variable omitida está presente en un modelo de regresión simple cuando una variable que debería estar en el modelo no lo está, y está correlacionada con el regresor incluido. Incluir variables adicionales en una regresión múltiple puede eliminar este sesgo.
Modelo de regresión múltiple: El modelo de regresión múltiple extiende el modelo de regresión con una sola variable para incluir múltiples variables independientes, permitiendo examinar la relación entre una variable dependiente y varias variables independientes simultáneamente.
El modelo de regresión múltiple es Y_i=B_0+B_1 X_{1i} + B_2 X_{2i} + … +B_k X_{ki} donde Y_i es la variable dependiente, X_{1i}, X_{2i}, …, X_{ki} son las variables independientes, B_0,B_1,…,B_k son los coeficientes, y u_i es el término de error.
Por qué la regresión múltiple es útil: La regresión múltiple es útil porque permite estimar el efecto de una variable mientras se mantienen las demás constantes. Además de resolver el sesgo por variable omitida, permite flexibilidad en la forma funcional.
Motivación para la regresión múltiple: El análisis de regresión múltiple permite incluir más de una variable que afecta a la variable que se intenta explicar, considerando una relación ceteris paribus entre las variables explicadas y explicativas.
El modelo general de regresión múltiple es dado por y=B_0 + B_1 x_1 + B_2 x_2 + … + B_k x_k + u, donde y es la variable dependiente, x_1, x_2, …, x_k son las variables independientes, y u es el término de error.
Mecánica e interpretación de los Mínimos Cuadrados Ordinarios (MCO):
Obtener estimaciones por MCO: Las estimaciones por MCO se obtienen minimizando la suma de los residuos al cuadrado.
Interpretación de la ecuación de regresión múltiple: La ecuación de regresión múltiple se interpreta como el cambio estimado en la variable dependiente ante un cambio de una unidad en la variable independiente, manteniendo constantes las demás variables independientes. La frase “manteniendo constantes todos los demás factores” es crucial en la regresión múltiple.
Cambiar simultáneamente más de una variable independiente:
El cambio previsto en y debido a cambios en múltiples variables independientes se obtiene sumando los efectos individuales.
Valores ajustados por MCO y residuos:
Los valores ajustados son los valores predichos de la variable dependiente basados en la línea de regresión por MCO. Los residuos son las diferencias entre los valores reales y los ajustados.
Interpretación de “exclusión parcial” de la regresión múltiple:
La regresión múltiple proporciona una interpretación de exclusión parcial, donde el coeficiente de una variable independiente representa el efecto de esa variable después de excluir los efectos de las demás variables independientes.
Estimaciones de regresión simple y múltiple:
Las estimaciones de regresión simple y múltiple difieren cuando las variables independientes están correlacionadas.
Bondad de ajuste:
R-cuadrado mide la proporción de la variación total en la variable dependiente que es explicada por las variables independientes. Añadir más variables independientes siempre aumentará el R-cuadrado.
Regresión a través del origen:
En ciertos casos, se estima una regresión a través del origen, donde la intersección se fuerza a ser cero.