Midterm Review: 计量经济学基础

大纲
  1. 第一部分:基础、数据与因果关系

  2. 第二部分:简单回归模型

  3. 第三部分:OLS 的统计性质

  4. 第四部分:多元回归模型 I

  5. 第五部分 A:多元回归模型 II - 方差与 BLUE

  6. 第五部分 B:统计推断 I

  7. 第六部分:统计推断 II(联合假设与 F 检验)

  8. 第七部分:进一步问题(大样本、函数形式、模型选择)

第一部分:基础、数据与因果关系
1.1 经验分析框架
  • 计量经济学架起了抽象经济理论与现实非实验数据之间的桥梁。

  • 经验分析的逻辑步骤:1. 提出一个精确的问题,例如:教育是否提高工资? 2. 指定一个经济模型:基于微观/宏观理论的基础关系,表示为 y=f(x<em>1,x</em>2,ext,xk)y = f(x<em>1, x</em>2, ext{…}, x_k)。3. 制定计量经济模型:解决模糊性、定义功能形式并考虑不精确关系。 4. 统计推断:使用样本数据估计参数、构建置信区间并检验假设。

1.2 计量经济模型的解剖
  • 经济模型表示准确关系。

  • 计量经济模型必须考虑现实世界的变异性,使用随机误差项 uu

  • 示例:教育回报模型 工资=𝛼<em>0+𝛼</em>1exteduc+𝛼2extexper+u工资 = 𝛼<em>0 + 𝛼</em>1 ext{educ} + 𝛼_2 ext{exper} + u

  • 组件的数学逻辑:- 参数 (𝛼<em>j𝛼<em>j):表示 x</em>jx</em>jyy 的边际影响。 - 𝛼1=extwageexteduc𝛼_1 = \frac{\partial ext{wage}}{\partial ext{educ}}(在其他因素固定的情况下)。 - 误差项 (uu):捕捉 yy 的所有未观察到的决定因素。在工资模型中,uu 包括先天能力、家庭背景和运气。

1.3 因果关系与相关性以及其他条件
  • 发现统计相关性是简单的,证明因果关系是计量经济学的核心目标。

  • “其他条件不变”条件:为了因果解释 𝛼<em>1𝛼<em>1,我们必须保持所有相关因素(包括 uu)恒定。- y=𝛼</em>1x1+u\triangle y = 𝛼</em>1 \triangle x_1 + \triangle u

  • 偏差的逻辑推导:如果我们想要真实的效果,我们需要 u=0\triangle u = 0

  • 问题:如果研究变量 (x<em>1x<em>1) 与未观察到的因素 (uu) 相关,我们无法孤立 𝛼</em>1𝛼</em>1

  • 示例:如果我们观察出勤率和成绩,智力 (uu) 影响二者。除非出勤率与 uu 独立,否则相关性不等于因果关系。

练习 Q1:因果关系与内生性
  • 场景:市长对 100 个城市的横截面数据进行回归。他发现 𝛼_1 > 0(更多警察与更多犯罪相关联),因此建议解雇警察以降低犯罪率。

  • 问题:利用其他条件和误差项 uu 的概念,解释市长统计逻辑中的致命缺陷。为什么 𝛼1𝛼_1 为正?用 OVB 的公式解释。

练习 Q1:问题解答
  1. 缺陷(同时性/反向因果关系):市长假定增加警察会导致犯罪率上升。然而,自然高犯罪环境的城市(uu 中的不可观察因素)响应地雇佣更多警察。

  2. 通过偏差解释正系数:𝛼<em>1ext大约等于𝛼</em>ext+ext偏差𝛼<em>1 ext{大约等于} 𝛼</em>{ ext{真}} + ext{偏差}。- 𝛼ext𝛼_{ ext{真}}:理论上更多警察应减少犯罪。 - ext偏差ext{偏差}:高犯罪环境(uu 升高)导致城市雇佣更多警察(警察数量上升)。 - ext影响(u)ext{影响} (u):正向。较差的基础环境直接增加了犯罪率。

  • 结论:正偏差项 (ext偏差×ext影响ext{偏差} \times ext{影响}) 压倒负效果,使得估计的相关性为正。

第二部分:简单回归模型
2.1 简单线性回归的逻辑
  • 人口模型(未知的真相): y=𝛼<em>0+𝛼</em>1x+uy = 𝛼<em>0 + 𝛼</em>1 x + u

  • 关键假设:零条件均值 E(ux)=E(u)=0E(u|x) = E(u) = 0。- 不可观察的因素 uu 必须与 xx 的均值独立。这允许我们定义人口回归函数 (PRF):E(yx)=𝛼<em>0+𝛼</em>1xE(y|x) = 𝛼<em>0 + 𝛼</em>1 x

2.2 OLS 的数学推导
  • 我们无法观察到真实的 𝛼<em>0,𝛼</em>1𝛼<em>0, 𝛼</em>1。我们通过样本 ig( (xi, yi)_{i=1}^n\big) 来估计它们。

  • 最小二乘法原则(OLS):最小化残差平方和(SSR)。

  • 数学推导:最小化 extSSR=extminimize<em>𝛼</em>0,𝛼<em>1(rac1n</em>i=1n(y<em>i𝛼</em>0𝛼<em>1x</em>i)2)ext{SSR} = ext{minimize}<em>{𝛼</em>0, 𝛼<em>1} \left( rac{1}{n} \sum</em>{i=1}^n (y<em>i - 𝛼</em>0 - 𝛼<em>1 x</em>i)^2 \right)

  • 一阶条件(FOCs):取偏导数置于 0。- 𝛼<em>0</em>iu<em>i=0\frac{\partial}{\partial 𝛼<em>0} \sum</em>{i} u<em>i = 0(残差和为零)。 - 𝛼</em>1<em>ix</em>iui=0\frac{\partial}{\partial 𝛼</em>1} \sum<em>{i} x</em>i u_i = 0(残差与 xx 不相关)。

2.3 OLS 估计公式推导
  • 从 FOC(1)出发,除以 nn 得到截距估计量:- OLS 截距估计量:𝛼<em>0=yˉ𝛼</em>1xˉ𝛼<em>0 = \bar{y} - 𝛼</em>1 \bar{x}。 - 代入 𝛼<em>0𝛼<em>0 于 FOC(2):</em>ix<em>i[y</em>i(yˉ𝛼<em>1xˉ)𝛼</em>1xi]=0\sum</em>{i} x<em>i[y</em>i - (\bar{y} - 𝛼<em>1 \bar{x}) - 𝛼</em>1 x_i] = 0

  • 通过求和代数属性,我们获得精确的 OLS 斜率估计量:- OLS 斜率估计量:𝛼<em>1=</em>i(x<em>ixˉ)(y</em>iyˉ)<em>i(x</em>ixˉ)2=Cov(x,y)Var(x)𝛼<em>1 = \frac{\sum</em>{i} (x<em>i - \bar{x})(y</em>i - \bar{y})}{\sum<em>{i} (x</em>i - \bar{x})^2} = \frac{\text{Cov}(x, y)}{\text{Var}(x)}

2.4 拟合优度 (R²)
  • 样本回归线的拟合程度(y~<em>i=𝛼</em>0+𝛼<em>1x</em>i\tilde{y}<em>i = 𝛼</em>0 + 𝛼<em>1 x</em>i)有多好?- 方差分解:SST = SSE + SSR - SST(总平方和): (y<em>iyˉ)2\sum (y<em>i - \bar{y})^2 - SSE(解释平方和): (y~</em>iyˉ)2\sum (\tilde{y}</em>i - \bar{y})^2 - SSR(残差平方和): (ui2)\sum (u_i^2)

  • R 平方 (R²):因变量总变异的分数由自变量解释。- R2=SSESST=1SSRSST(0R21)R² = \frac{SSE}{SST} = 1 - \frac{SSR}{SST} (0 \leq R² \leq 1)

  • 陷阱:较低的 R² 不一定意味着模型无用,较高的 R² 也不证明因果关系!它只测量线性拟合。

2.5 函数形式(对数)
  • 应用自然对数(对数)改变 𝛼1𝛼_1 的经济解释:从绝对单位变化到百分比变化。

模型与解释:

依赖变量

自变量

𝛼1𝛼_1 的解释

Level-Level

yy

y=𝛼1x\triangle y = 𝛼_1 \triangle x

Level-Log

yy

y𝛼1100x\triangle y \rightarrow \frac{𝛼_1}{100} \triangle x

Log-Level

log(y)\log(y)

y(100𝛼1)x\triangle y \rightarrow (100 𝛼_1) \triangle x

Log-Log

log(y)\log(y)

y𝛼1x\triangle y \rightarrow 𝛼_1 \triangle x

  • 示例(Log-Level):log(工资)=0.584+0.083educ\log(\text{工资}) = 0.584 + 0.083 \text{educ},即增加一年的教育,工资大约增加 8.3%。

练习 Q2:OLS 属性与函数形式
  1. A 问题:使用一阶条件证明 OLS 样本回归线总是正好通过样本平均 (\bar{x}, \bar{y})。

  2. B 问题:一个研究者估计 CEO 工资和公司销售额的常数弹性模型 log(工资)=4.822+0.257log(销售)\log(\text{工资}) = 4.822 + 0.257 \log(\text{销售}),R² = 0.95。 - a) 如果公司销售额增加 10%,预计 CEO 工资变化百分比是多少? - b) R² = 0.95 是否保证公司销售额严格导致 CEO 工资?

练习 Q2:问题解答
  1. 答案:开始于 FOC:(y<em>i𝛼</em>0𝛼<em>1x</em>i)=0\sum(y<em>i - 𝛼</em>0 - 𝛼<em>1 x</em>i) = 0,分配求和:y<em>in𝛼</em>0𝛼<em>1x</em>i=0\sum y<em>i - n 𝛼</em>0 - 𝛼<em>1 \sum x</em>i = 0。整体方程除以 nnyˉ=𝛼<em>0+𝛼</em>1xˉ\bar{y} = 𝛼<em>0 + 𝛼</em>1 \bar{x},意味着 yˉ𝛼<em>0𝛼</em>1xˉ=0\bar{y} - 𝛼<em>0 - 𝛼</em>1 \bar{x} = 0

  2. 答案:1. 这是一个对数-对数模型。系数 0.257 是弹性。如果销售额增长 10%,则工资增长 10% × 0.257 = 2.57%。2. 不是。R² 仅测量解释的方差(相关性),而不测量因果关系。未观察到的因素 (uu),如 CEO 任期或公司行业,可能同时驱动这两个变量。

第三部分:OLS 的统计性质
3.1 第三周的核心逻辑
  • 基本观点:由于我们的数据 ((x<em>i,y</em>i)<em>i=1n)\big( (x<em>i, y</em>i)<em>{i=1}^n \big) 是从随机样本中抽取的,因此 OLS 估计量 𝛼</em>0𝛼</em>0𝛼1𝛼_1 是从随机数据计算得出的。

  • 两个关键问题用于评估估计量: 1. 中心趋势:估计量是否平均击中真实人口参数?(E(𝛽<em>1)E(𝛽<em>1) 怎么样?) 2. 离散度:这些估计在不同随机样本中有多大波动?(Var(𝛽</em>1)\text{Var}(𝛽</em>1) 怎么样?)

3.2 简单回归的五个假设

为了建立 OLS 的统计性质,我们依赖于高斯-马尔可夫假设:

  • SLR.1(参数线性):人口模型为 y=𝛼<em>0+𝛼</em>1x+uy = 𝛼<em>0 + 𝛼</em>1 x + u

  • SLR.2(随机抽样):我们有一个大小为 nn 的随机样本。

  • SLR.3(样本中 xx 的变异):样本结果在 xx 上不是完全相同的(SST_x > 0)。

  • SLR.4(零条件均值):E(ux)=0E(u|x) = 0

  • SLR.5(同方差性):extVar(ux)=σ2ext{Var}(u|x) = \sigma^2。随着 xx 的变化,误差的方差是常数。

  • 假设 SLR.1 到 SLR.4 是证明无偏性所需的充分条件。加入 SLR.5 使我们能够计算 OLS 的方差。

3.3 数学推导:无偏性(第 1 部分)
  • 定理 2.1:E(β<em>1)=β</em>1E(β<em>1) = β</em>1。步骤 1:将 β<em>1β<em>1 表述为真实的 β</em>1β</em>1 和误差 uu。回忆 OLS 公式:β<em>1=(x</em>ixˉ)y<em>iSST</em>xβ<em>1 = \frac{\sum (x</em>i - \bar{x}) y<em>i}{SST</em>x}

  • 步骤 2:将真实的人口模型 y<em>i=𝛼</em>0+𝛼<em>1x</em>i+u<em>iy<em>i = 𝛼</em>0 + 𝛼<em>1 x</em>i + u<em>i 代入:β</em>1=(x<em>ixˉ)(𝛼</em>0+𝛼<em>1x</em>i+u<em>i)SST</em>xβ</em>1 = \frac{\sum (x<em>i - \bar{x})(𝛼</em>0 + 𝛼<em>1 x</em>i + u<em>i)}{SST</em>x}。- 使用求和代数((x<em>ixˉ)=0\sum (x<em>i - \bar{x}) = 0(x</em>ixˉ)x<em>i=SST</em>x\sum (x</em>i - \bar{x}) x<em>i = SST</em>x),𝛼<em>0𝛼<em>0 项消失,𝛼</em>1𝛼</em>1 项简化为 β<em>1β<em>1β</em>1=β<em>1+σ2(x</em>ixˉ)u<em>iSST</em>xβ</em>1 = β<em>1 + \sigma^2 \frac{\sum (x</em>i - \bar{x}) u<em>i}{SST</em>x}

  • 步骤 3:把期望值取样本条件关于 XXE(β<em>1X)=E(β</em>1+w<em>iu</em>iX)E(β<em>1|X) = E(β</em>1 + \frac{\sum w<em>i u</em>i}{X})。- 因为 β<em>1β<em>1 是常数,而 w</em>iw</em>i 在条件上看作常数:E(β<em>1X)=β</em>1+w<em>iE(u</em>ix<em>i)E(β<em>1|X) = β</em>1 + \sum w<em>i E(u</em>i|x<em>i)。根据 SLR.4(E(u</em>ix<em>i)=0E(u</em>i|x<em>i) = 0),第二项整体消失,得到仍然是 𝛼</em>1𝛼</em>1

  • OLS 的无偏性解释:E(β<em>1)=β</em>1E(β<em>1) = β</em>1

3.4 数学推导:OLS 方差
  • β1β_1 在样本间波动的程度?

  • 我们计算 extVar(β<em>1X)ext{Var}(β<em>1|X)。从我们之前的分解开始: β</em>1=β<em>1+w</em>iuiβ</em>1 = β<em>1 + \sum w</em>i u_i

  • extVar(β<em>1X)=extVar(β</em>1+w<em>iu</em>iX)=w<em>i2extVar(u</em>ixi)ext{Var}(β<em>1|X) = ext{Var}(β</em>1 + \sum w<em>i u</em>i | X) = \sum w<em>i^2 ext{Var}(u</em>i|x_i)

  • 应用 SLR.5(同方差性):extVar(ux<em>i)=σ2ext{Var}(u|x<em>i) = \sigma^2,因此 extVar(β</em>1X)=σ2w<em>i2=σ2SST</em>x=σ2n(xixˉ)2ext{Var}(β</em>1|X) = \sigma^2 \sum w<em>i^2 = \frac{\sigma^2}{SST</em>x} = \frac{\sigma^2}{n \sum (x_i - \bar{x})^2}

练习 Q3:OLS 方差(问题)

问题:一名研究者正在调查学习小时数 ($x$) 对考试成绩 ($y$) 的影响。她意识到她需要更精确的 β<em>1β<em>1 估计(即,她想减少 extVar(β</em>1)ext{Var}(β</em>1))。基于公式 extVar(β<em>1)=σ2[n(x</em>ixˉ)2]ext{Var}(β<em>1) = \sigma^2 [n \sum (x</em>i - \bar{x})^2],列出两种不同方式来改变她的采样设计以减少 OLS 估计器的方差。

练习 Q3:问题解答
  • 分析解决方案:1. 增加样本大小 (nn)。随着 nn 的增加,分母 SST<em>xSST<em>x 越来越大。方差的收缩速率为 1/n1/n。(更多数据 = 更高的精度)。 2. 增加 xx 的变异性(SST</em>xSST</em>x)。如果她特别瞄准学习 0 小时和学习 50 小时的学生,她就人为地增加了 xx 的分散性(增加 SSTxSST_x)。更多的 xx 变异让 OLS 保持“锚”,从而大幅降低方差。

练习问题 Q4:无偏性与残差
  • 问题:”因为 OLS 算法代数上保证样本残差和为零(u<em>i=0\sum u<em>i = 0),所以 OLS 估计量 β</em>0β</em>0β1β_1 也被保证是统计无偏的”。解释你的理由。

练习问题 Q4:答案解答
  • 错误。ui=0\sum u_i = 0 是 OLS 计算算法在任何给定样本中强制为真的纯数学/代数属性。

  • 无偏性 E[β]=βE[β] = β 是关于总体和样本过程的统计属性。它严格要求假设 SLR.4(E(ux)=0E(u|x) = 0)。如果你遗漏了某个变量(导致内生性),SLR.4 失败。OLS 仍然可以计算出一个残差和为零的线,但结果 β1β_1 将会存在系统偏差!

第四部分:多元回归模型 I
4.1 多元回归的逻辑
  • 为什么要超越简单线性回归?1. 解决内生性:在简单回归中,未观察到的因素被放入 uu 中。如果它们与 xx 相关,β1β_1 是偏差的。 2. 更好的因果推断:通过控件减少混杂因素,我们更接近真实的“其他条件不变”效应。 3. 灵活的函数形式:使用多项式(例如,incincinc2inc^2)允许非线性关系。

  • 多元线性回归(MLR)模型:y=β<em>0+𝛼</em>1x<em>1+𝛼</em>2x<em>2++β</em>kx<em>k+uy = β<em>0 + 𝛼</em>1 x<em>1 + 𝛼</em>2 x<em>2 + … + β</em>k x<em>k + u。- β</em>1β</em>1 衡量在固定 x<em>2,,x</em>kx<em>2,…, x</em>kuu 的情况下,yy 预期变化的变化,给定 x1x_1 增加 1 个单位。

4.2 遗漏变量偏差(OVB):推导
  • 如果我们遗漏一个相关变量会发生什么?- 真实模型:y=β<em>0+𝛼</em>1x<em>1+𝛼</em>2x<em>2+uy = β<em>0 + 𝛼</em>1 x<em>1 + 𝛼</em>2 x<em>2 + u。 - 估计(不足规格)模型: ildey=β</em>ilde0+𝛼ilde1x<em>1ilde{y} = β</em> ilde{0} + 𝛼_ ilde{1} x<em>1。 - 偏差数学推导:来源于简单回归:{𝛼 ilde{1} = \frac{\sum{i}(x{i1} - \bar{x}1) yi}{(x{i1} - \bar{x}1)^2} 。替换真实模型 yiy_i

  • 偏差公式: E(𝛼ilde1)=𝛼<em>1+𝛼</em>2𝜖<em>1~E(𝛼_ ilde{1}) = 𝛼<em>1 + 𝛼</em>2 \tilde{𝜖<em>1},其中 𝜖</em>1~\tilde{𝜖</em>1}x<em>2x<em>2 关于 x</em>1x</em>1 的回归斜率。

4.3 解读 OVB 的方向
  • 偏差等式:Bias(𝛼ilde1)=E(𝛼ilde1)𝛼<em>1=𝛼</em>2𝜖1~\text{Bias}(𝛼_ ilde{1}) = E(𝛼_ ilde{1}) - 𝛼<em>1 = 𝛼</em>2 \tilde{𝜖_1}

  • 偏差的方向取决于两个因素:1. β<em>2β<em>2:遗漏变量对 yy 的真实影响。 2. 𝜖</em>1~\tilde{𝜖</em>1}x<em>1x<em>1x</em>2x</em>2 的相关性。

  • 当 \text{Corr}(x1, x2) > 0,Bias(𝛼ilde1)\text{Bias}(𝛼_ ilde{1}) 存在上升偏见。 - 当 \text{Corr}(x1, x2) < 0 ,Bias(𝛼ilde1)\text{Bias}(𝛼_ ilde{1}) 存在下降偏见。

  • 直观理解:如果 x<em>1x<em>1x</em>2x</em>2 一同移动,而 x<em>2x<em>2 提高 yy,忽略 x</em>2x</em>2 会迫使 𝛼ilde1𝛼_ ilde{1}x<em>2x<em>2 的效果“背书”,使 𝛼</em>ilde1𝛼</em> ilde{1} 人为增大。

练习 Q5:添加变量与 R²
  1. 问题:你对学习小时的简单回归进行回归。然后你决定添加鞋子尺寸作为第二个自变量。 是 R² 增加还是减少?包括一个无关变量会使 βext学习β_{ ext{学习}} 变偏吗?

练习 Q5:练习解答
  1. 解析解决方案:- 1. R² 行为:添加自变量时,R² 绝不会减少,即使它完全无关(如鞋子尺寸)。它只会保持完全不变(如果估计的系数正好为零),或者略微增加由于随机机会的拟合。 - 2. 无偏性:包括不相关的变量(β<em>ext=0β<em>{ ext{鞋}}=0)被称为“过度指定模型”。这不会导致偏倚 (E[β</em>ext学习]=βext学习E[β</em>{ ext{学习}}]=β_{ ext{学习}})。但它浪费了自由度,可能人为地膨胀了你估计的方差。

4.5 R² 为什么永远不会减少
  • 为何在添加变量时,SSR 下降尽可能的(至少不会增加)。

  • 你的直觉完全正确:为OLS回归添加自变量总是会导致残差平方和 (SSRSSR) 下降(或至多保持完全不变)。

  • 供了解释,其数学证明:当 OLS 估计未约束模型时,算法是否能寻找 BB 的绝对最小平方值的二次形式的目标。

练习 Q6:评估 OVB 方向
  • 问题:你想测量计算机培训程序 (train = 1) 对工人生产力 (prod) 的影响。真实模型: prod=β<em>0+β</em>1train+β<em>2innateext能力+uprod = β<em>0 + β</em>1 train + β<em>2 innate ext{能力} + u。然而,公司仅强制表现最差(最低先天能力)的工人进行培训。如果你简单回归了 prodprod 关于 traintrain,则 𝛼</em>ilde1𝛼</em> ilde{1} 的偏移方向是什么?

练习 Q6:问题解答
  • 解析解决方案:使用公式:偏差 = β<em>2Corr(x</em>1,x2)β<em>2 · \text{Corr}(x</em>1, x_2)

  1. β<em>2β<em>2 的符号:先天能力逻辑上提高生产力,因此 β2 > 0(+)。

  2. 相关性的符号:低能力工人接受培训。因此,traintraininnateext能力innate ext{能力} 负相关。 \text{Corr}(x1, x2)< 0(-)。

  3. 结果:(+)()=()(+)(-)=(-)。结论:估计的 𝛼ilde1𝛼_ ilde{1} 将严重低估培训程序的实际有效性。