Wooldridge
Capitulo 2: modelo de regresión simple:
El modelo de regresión simple se usa para estudiar la relación entre dos variables. Presenta limitaciones como herramienta general para el análisis empírico (un enfoque basado en la evidencia y experiencia para el estudio o basado en los 5 sentidos) .
Definición del modelo de regresión simple: Los análisis parten de la siguiente premisa; se tiene Y y X y se desea explicar “como varia Y cuando varia X” Los tres aspectos que se toman en consideración (sabiendo que nunca hay una relación exacta entre variables) : ¿Como pueden tenerse en cuenta otros factores que afecten a y?, ¿Cuál es la relación funcional entre Y y X?, ¿Como se puede estar seguro de que la relación entre Y y X sea una relación ceteris paribus entre Y y X si ese es el objetivo?
la ecuación que resuelve las ambigüedades que relacionan a X y Y es:
A esta ecuación también se le llama modelo de regresión linean de dos variables o bivariada.
Y = variable dependiente, variable explicada, la variable de respuesta, variable predicha
X =variable independiente, variable explicativa, variable de control, variable predictora
u = termino de error o perturbación (factores de x que afectan a y)
= parametro de la pendiente
= parametro del intercepto o constante
CAP 2. 38-41
Propiedades algebraicas de los estadísticos de MCO:
Explica qué propiedades matemáticas tienen las estimaciones de MCO
Explica cómo se descompone la variación de la variable Y
Introduce Y y explica la R cuadrada y como No debe interpretarse mal
Empieza a explicar qué pasa cuando cambian las unidades de medición
MCO:
MCO (Mínimos cuadrados ordinario) es un método que encuentra la mejor linea posible.
Para explicar Y usando X
Minimizando los errores al cuadrado
Ecuación:
Valores ajustado
residuales
¿Que es un residual? es
lo que la regresión no pudo explicar para cada observación
Propiedad 1: La suma de los residuales es cero
la suma (y el promedio) de los residuales de MCO es cero, que significa que algunos residuales son positivos y otros negativos y se cancelan entre si. la recta se coloca de una forma que no se pase para arriba y no se pase para abajo. Esto no significa que cada residual sea cero, significa que en promedio la regresión no se equivoca.
Propiedad 2: La covarianza ( no se mueven juntas) entre x y los residuales es cero.
Si X es grande, el error no tiende a ser grande
Si x es pequeño, el error no tiende a ser pequeño
Esto es una propiedad mécanica de MCO
Propiedad 3: El punto promedio siempre está en la recta (x,y) siempre cae sobre la línea de regresión MCO.
Esto significa que si metes el valor promedio de x en la ecuación, obtienes exactamente el promedio de y. la recta pasa por el centro de los datos.
Valores ajustados y residuales:
Esto significa: parte explicada por el modelo y parte no explicada, el promedio de es igual al promexio de yi; y no estan correlacionados.
Interpretación profunda: MCO divide la realidad en: “lo que el modelo explica y lo que el modelo no puede explicar”
Descomposición de la varianza!!
STC - suma total de cuadrados
Mide: que tan dispersos están los valores reales de y
es la variación total.
SEC - Suma explicada de cuadrados
Mide: qué parte de esa variación es explicada por la regresión
SRC - suma residual de cuadrados
Mide: que parte no es explicada (ERROR)
Identidad clave : STC=SEC + SRC
todo lo que pasa con y se divide en, lo que el modelo explica y lo que queda sin explicar.
Bondad de ajuste: R cuadrada
Definición:
Interpretación: R al cuadrado es la proporción de la variación de y que es explicada por x. EJ: = 0.30 → x explica el 30% de la variación de y
Limites:
siempre está entre 0 y 1
= 1 es el ajuste perfecto
= 0 ajuste pobre
una R al cuadrado baja no significa que el modelo sea inutil, es normal que sea baja
Unidades de medición.
Si cambias la unidad de Y: el intercepto y la pendiente se multiplican por la misma constante
Si cambias la unidad de X: la pendiente cambien pero la interpretación econometríca se conserva