Midterm Review: 计量经济学基础

大纲

第一部分：基础、数据与因果关系
第二部分：简单回归模型
第三部分：OLS 的统计性质
第四部分：多元回归模型 I
第五部分 A：多元回归模型 II - 方差与 BLUE
第五部分 B：统计推断 I
第六部分：统计推断 II（联合假设与 F 检验）
第七部分：进一步问题（大样本、函数形式、模型选择）

第一部分：基础、数据与因果关系

1.1 经验分析框架

计量经济学架起了抽象经济理论与现实非实验数据之间的桥梁。
经验分析的逻辑步骤：1. 提出一个精确的问题，例如：教育是否提高工资？ 2. 指定一个经济模型：基于微观/宏观理论的基础关系，表示为 $y = f(x1, x2, ext{…}, x_k)$ 。3. 制定计量经济模型：解决模糊性、定义功能形式并考虑不精确关系。 4. 统计推断：使用样本数据估计参数、构建置信区间并检验假设。

1.2 计量经济模型的解剖

经济模型表示准确关系。
计量经济模型必须考虑现实世界的变异性，使用随机误差项 $u$ 。
示例：教育回报模型 $工资 = 𝛼0 + 𝛼1 ext{educ} + 𝛼_2 ext{exper} + u$ 。
组件的数学逻辑：- 参数 ( $𝛼j$ )：表示 $xj$ 对 $y$ 的边际影响。 - $𝛼_1 = \frac{\partial ext{wage}}{\partial ext{educ}}$ （在其他因素固定的情况下）。 - 误差项 ( $u$ )：捕捉 $y$ 的所有未观察到的决定因素。在工资模型中， $u$ 包括先天能力、家庭背景和运气。

1.3 因果关系与相关性以及其他条件

发现统计相关性是简单的，证明因果关系是计量经济学的核心目标。
“其他条件不变”条件：为了因果解释 $𝛼1$ ，我们必须保持所有相关因素（包括 $u$ ）恒定。- $\triangle y = 𝛼1 \triangle x_1 + \triangle u$ 。
偏差的逻辑推导：如果我们想要真实的效果，我们需要 $\triangle u = 0$ 。
问题：如果研究变量 ( $x1$ ) 与未观察到的因素 ( $u$ ) 相关，我们无法孤立 $𝛼1$ 。
示例：如果我们观察出勤率和成绩，智力 ( $u$ ) 影响二者。除非出勤率与 $u$ 独立，否则相关性不等于因果关系。

练习 Q1：因果关系与内生性

场景：市长对 100 个城市的横截面数据进行回归。他发现 𝛼_1 > 0（更多警察与更多犯罪相关联），因此建议解雇警察以降低犯罪率。
问题：利用其他条件和误差项 $u$ 的概念，解释市长统计逻辑中的致命缺陷。为什么 $𝛼_1$ 为正？用 OVB 的公式解释。

练习 Q1：问题解答

缺陷（同时性/反向因果关系）：市长假定增加警察会导致犯罪率上升。然而，自然高犯罪环境的城市（ $u$ 中的不可观察因素）响应地雇佣更多警察。
通过偏差解释正系数： $𝛼1 ext{大约等于} 𝛼{ ext{真}} + ext{偏差}$ 。- $𝛼_{ ext{真}}$ ：理论上更多警察应减少犯罪。 - $ext{偏差}$ ：高犯罪环境（ $u$ 升高）导致城市雇佣更多警察（警察数量上升）。 - $ext{影响} (u)$ ：正向。较差的基础环境直接增加了犯罪率。

结论：正偏差项 ( $ext{偏差} \times ext{影响}$ ) 压倒负效果，使得估计的相关性为正。

第二部分：简单回归模型

2.1 简单线性回归的逻辑

人口模型（未知的真相）： $y = 𝛼0 + 𝛼1 x + u$ 。
关键假设：零条件均值 $E(u|x) = E(u) = 0$ 。- 不可观察的因素 $u$ 必须与 $x$ 的均值独立。这允许我们定义人口回归函数 (PRF)： $E(y|x) = 𝛼0 + 𝛼1 x$ 。

2.2 OLS 的数学推导

我们无法观察到真实的 $𝛼0, 𝛼1$ 。我们通过样本 ig( (xi, yi)_{i=1}^n\big) 来估计它们。
最小二乘法原则（OLS）：最小化残差平方和（SSR）。
数学推导：最小化 $ext{SSR} = ext{minimize}{𝛼0, 𝛼1} \left( rac{1}{n} \sum{i=1}^n (yi - 𝛼0 - 𝛼1 xi)^2 \right)$ 。
一阶条件（FOCs）：取偏导数置于 0。- $\frac{\partial}{\partial 𝛼0} \sum{i} ui = 0$ （残差和为零）。 - $\frac{\partial}{\partial 𝛼1} \sum{i} xi u_i = 0$ （残差与 $x$ 不相关）。

2.3 OLS 估计公式推导

从 FOC（1）出发，除以 $n$ 得到截距估计量：- OLS 截距估计量： $𝛼0 = \bar{y} - 𝛼1 \bar{x}$ 。 - 代入 $𝛼0$ 于 FOC（2）： $\sum{i} xi[yi - (\bar{y} - 𝛼1 \bar{x}) - 𝛼1 x_i] = 0$ 。
通过求和代数属性，我们获得精确的 OLS 斜率估计量：- OLS 斜率估计量： $𝛼1 = \frac{\sum{i} (xi - \bar{x})(yi - \bar{y})}{\sum{i} (xi - \bar{x})^2} = \frac{\text{Cov}(x, y)}{\text{Var}(x)}$ 。

2.4 拟合优度 (R²)

样本回归线的拟合程度（ $\tilde{y}i = 𝛼0 + 𝛼1 xi$ ）有多好？- 方差分解：SST = SSE + SSR - SST（总平方和）: $\sum (yi - \bar{y})^2$ - SSE（解释平方和）: $\sum (\tilde{y}i - \bar{y})^2$ - SSR（残差平方和）: $\sum (u_i^2)$ 。
R 平方 (R²)：因变量总变异的分数由自变量解释。- $R² = \frac{SSE}{SST} = 1 - \frac{SSR}{SST} (0 \leq R² \leq 1)$ 。
陷阱：较低的 R² 不一定意味着模型无用，较高的 R² 也不证明因果关系！它只测量线性拟合。

2.5 函数形式（对数）

应用自然对数（对数）改变 $𝛼_1$ 的经济解释：从绝对单位变化到百分比变化。

模型与解释：

依赖变量	自变量	$𝛼_1$ 的解释
Level-Level	$y$	$\triangle y = 𝛼_1 \triangle x$
Level-Log	$y$	$\triangle y \rightarrow \frac{𝛼_1}{100} \triangle x$
Log-Level	$\log(y)$	$\triangle y \rightarrow (100 𝛼_1) \triangle x$
Log-Log	$\log(y)$	$\triangle y \rightarrow 𝛼_1 \triangle x$

示例（Log-Level）： $\log(\text{工资}) = 0.584 + 0.083 \text{educ}$ ，即增加一年的教育，工资大约增加 8.3%。

练习 Q2：OLS 属性与函数形式

A 问题：使用一阶条件证明 OLS 样本回归线总是正好通过样本平均 (\bar{x}, \bar{y})。
B 问题：一个研究者估计 CEO 工资和公司销售额的常数弹性模型 $\log(\text{工资}) = 4.822 + 0.257 \log(\text{销售})$ ，R² = 0.95。 - a) 如果公司销售额增加 10%，预计 CEO 工资变化百分比是多少？ - b) R² = 0.95 是否保证公司销售额严格导致 CEO 工资？

练习 Q2：问题解答

答案：开始于 FOC： $\sum(yi - 𝛼0 - 𝛼1 xi) = 0$ ，分配求和： $\sum yi - n 𝛼0 - 𝛼1 \sum xi = 0$ 。整体方程除以 $n$ ： $\bar{y} = 𝛼0 + 𝛼1 \bar{x}$ ，意味着 $\bar{y} - 𝛼0 - 𝛼1 \bar{x} = 0$ 。
答案：1. 这是一个对数-对数模型。系数 0.257 是弹性。如果销售额增长 10%，则工资增长 10% × 0.257 = 2.57%。2. 不是。R² 仅测量解释的方差（相关性），而不测量因果关系。未观察到的因素 ( $u$ )，如 CEO 任期或公司行业，可能同时驱动这两个变量。

第三部分：OLS 的统计性质

3.1 第三周的核心逻辑

基本观点：由于我们的数据 $\big( (xi, yi){i=1}^n \big)$ 是从随机样本中抽取的，因此 OLS 估计量 $𝛼0$ 和 $𝛼_1$ 是从随机数据计算得出的。
两个关键问题用于评估估计量： 1. 中心趋势：估计量是否平均击中真实人口参数？（ $E(𝛽1)$ 怎么样？） 2. 离散度：这些估计在不同随机样本中有多大波动？（ $\text{Var}(𝛽1)$ 怎么样？）

3.2 简单回归的五个假设

为了建立 OLS 的统计性质，我们依赖于高斯-马尔可夫假设：

SLR.1（参数线性）：人口模型为 $y = 𝛼0 + 𝛼1 x + u$ 。
SLR.2（随机抽样）：我们有一个大小为 $n$ 的随机样本。
SLR.3（样本中 $x$ 的变异）：样本结果在 $x$ 上不是完全相同的（SST_x > 0）。
SLR.4（零条件均值）： $E(u|x) = 0$ 。
SLR.5（同方差性）： $ext{Var}(u|x) = \sigma^2$ 。随着 $x$ 的变化，误差的方差是常数。
假设 SLR.1 到 SLR.4 是证明无偏性所需的充分条件。加入 SLR.5 使我们能够计算 OLS 的方差。

3.3 数学推导：无偏性（第 1 部分）

定理 2.1： $E(β1) = β1$ 。步骤 1：将 $β1$ 表述为真实的 $β1$ 和误差 $u$ 。回忆 OLS 公式： $β1 = \frac{\sum (xi - \bar{x}) yi}{SSTx}$ 。
步骤 2：将真实的人口模型 $yi = 𝛼0 + 𝛼1 xi + ui$ 代入： $β1 = \frac{\sum (xi - \bar{x})(𝛼0 + 𝛼1 xi + ui)}{SSTx}$ 。- 使用求和代数（ $\sum (xi - \bar{x}) = 0$ 和 $\sum (xi - \bar{x}) xi = SSTx$ ）， $𝛼0$ 项消失， $𝛼1$ 项简化为 $β1$ ： $β1 = β1 + \sigma^2 \frac{\sum (xi - \bar{x}) ui}{SSTx}$ 。
步骤 3：把期望值取样本条件关于 $X$ 。 $E(β1|X) = E(β1 + \frac{\sum wi ui}{X})$ 。- 因为 $β1$ 是常数，而 $wi$ 在条件上看作常数： $E(β1|X) = β1 + \sum wi E(ui|xi)$ 。根据 SLR.4（ $E(ui|xi) = 0$ ），第二项整体消失，得到仍然是 $𝛼1$ 。
OLS 的无偏性解释： $E(β1) = β1$ 。

3.4 数学推导：OLS 方差

$β_1$ 在样本间波动的程度？
我们计算 $ext{Var}(β1|X)$ 。从我们之前的分解开始： $β1 = β1 + \sum wi u_i$ 。
$ext{Var}(β1|X) = ext{Var}(β1 + \sum wi ui | X) = \sum wi^2 ext{Var}(ui|x_i)$ 。
应用 SLR.5（同方差性）： $ext{Var}(u|xi) = \sigma^2$ ，因此 $ext{Var}(β1|X) = \sigma^2 \sum wi^2 = \frac{\sigma^2}{SSTx} = \frac{\sigma^2}{n \sum (x_i - \bar{x})^2}$ 。

练习 Q3：OLS 方差（问题）

问题：一名研究者正在调查学习小时数 ($x$) 对考试成绩 ($y$) 的影响。她意识到她需要更精确的 $β1$ 估计（即，她想减少 $ext{Var}(β1)$ ）。基于公式 $ext{Var}(β1) = \sigma^2 [n \sum (xi - \bar{x})^2]$ ，列出两种不同方式来改变她的采样设计以减少 OLS 估计器的方差。

练习 Q3：问题解答

分析解决方案：1. 增加样本大小 ( $n$ )。随着 $n$ 的增加，分母 $SSTx$ 越来越大。方差的收缩速率为 $1/n$ 。（更多数据 = 更高的精度）。 2. 增加 $x$ 的变异性（ $SSTx$ ）。如果她特别瞄准学习 0 小时和学习 50 小时的学生，她就人为地增加了 $x$ 的分散性（增加 $SST_x$ ）。更多的 $x$ 变异让 OLS 保持“锚”，从而大幅降低方差。

练习问题 Q4：无偏性与残差

问题：”因为 OLS 算法代数上保证样本残差和为零（ $\sum ui = 0$ ），所以 OLS 估计量 $β0$ 和 $β_1$ 也被保证是统计无偏的”。解释你的理由。

练习问题 Q4：答案解答

错误。 $\sum u_i = 0$ 是 OLS 计算算法在任何给定样本中强制为真的纯数学/代数属性。
无偏性 $E[β] = β$ 是关于总体和样本过程的统计属性。它严格要求假设 SLR.4（ $E(u|x) = 0$ ）。如果你遗漏了某个变量（导致内生性），SLR.4 失败。OLS 仍然可以计算出一个残差和为零的线，但结果 $β_1$ 将会存在系统偏差！

第四部分：多元回归模型 I

4.1 多元回归的逻辑

为什么要超越简单线性回归？1. 解决内生性：在简单回归中，未观察到的因素被放入 $u$ 中。如果它们与 $x$ 相关， $β_1$ 是偏差的。 2. 更好的因果推断：通过控件减少混杂因素，我们更接近真实的“其他条件不变”效应。 3. 灵活的函数形式：使用多项式（例如， $inc$ 和 $inc^2$ ）允许非线性关系。
多元线性回归（MLR）模型： $y = β0 + 𝛼1 x1 + 𝛼2 x2 + … + βk xk + u$ 。- $β1$ 衡量在固定 $x2,…, xk$ 和 $u$ 的情况下， $y$ 预期变化的变化，给定 $x_1$ 增加 1 个单位。

4.2 遗漏变量偏差（OVB）：推导

如果我们遗漏一个相关变量会发生什么？- 真实模型： $y = β0 + 𝛼1 x1 + 𝛼2 x2 + u$ 。 - 估计（不足规格）模型： $ilde{y} = β ilde{0} + 𝛼_ ilde{1} x1$ 。 - 偏差数学推导：来源于简单回归:{𝛼 ilde{1} = \frac{\sum{i}(x{i1} - \bar{x}1) yi}{(x{i1} - \bar{x}1)^2} 。替换真实模型 $y_i$ 。
偏差公式： $E(𝛼_ ilde{1}) = 𝛼1 + 𝛼2 \tilde{𝜖1}$ ，其中 $\tilde{𝜖1}$ 是 $x2$ 关于 $x1$ 的回归斜率。

4.3 解读 OVB 的方向

偏差等式： $\text{Bias}(𝛼_ ilde{1}) = E(𝛼_ ilde{1}) - 𝛼1 = 𝛼2 \tilde{𝜖_1}$ 。
偏差的方向取决于两个因素：1. $β2$ ：遗漏变量对 $y$ 的真实影响。 2. $\tilde{𝜖1}$ ： $x1$ 和 $x2$ 的相关性。
当 \text{Corr}(x1, x2) > 0， $\text{Bias}(𝛼_ ilde{1})$ 存在上升偏见。 - 当 \text{Corr}(x1, x2) < 0 ， $\text{Bias}(𝛼_ ilde{1})$ 存在下降偏见。
直观理解：如果 $x1$ 和 $x2$ 一同移动，而 $x2$ 提高 $y$ ，忽略 $x2$ 会迫使 $𝛼_ ilde{1}$ 为 $x2$ 的效果“背书”，使 $𝛼 ilde{1}$ 人为增大。

练习 Q5：添加变量与 R²

问题：你对学习小时的简单回归进行回归。然后你决定添加鞋子尺寸作为第二个自变量。是 R² 增加还是减少？包括一个无关变量会使 $β_{ ext{学习}}$ 变偏吗？

练习 Q5：练习解答

解析解决方案：- 1. R² 行为：添加自变量时，R² 绝不会减少，即使它完全无关（如鞋子尺寸）。它只会保持完全不变（如果估计的系数正好为零），或者略微增加由于随机机会的拟合。 - 2. 无偏性：包括不相关的变量（ $β{ ext{鞋}}=0$ ）被称为“过度指定模型”。这不会导致偏倚 ( $E[β{ ext{学习}}]=β_{ ext{学习}}$ )。但它浪费了自由度，可能人为地膨胀了你估计的方差。

4.5 R² 为什么永远不会减少

为何在添加变量时，SSR 下降尽可能的（至少不会增加）。
你的直觉完全正确：为OLS回归添加自变量总是会导致残差平方和 ( $SSR$ ) 下降（或至多保持完全不变）。
供了解释，其数学证明：当 OLS 估计未约束模型时，算法是否能寻找 $B$ 的绝对最小平方值的二次形式的目标。

练习 Q6：评估 OVB 方向

问题：你想测量计算机培训程序 (train = 1) 对工人生产力 (prod) 的影响。真实模型： $prod = β0 + β1 train + β2 innate ext{能力} + u$ 。然而，公司仅强制表现最差（最低先天能力）的工人进行培训。如果你简单回归了 $prod$ 关于 $train$ ，则 $𝛼 ilde{1}$ 的偏移方向是什么？

练习 Q6：问题解答

解析解决方案：使用公式：偏差 = $β2 · \text{Corr}(x1, x_2)$ 。

$β2$ 的符号：先天能力逻辑上提高生产力，因此 β2 > 0（+）。
相关性的符号：低能力工人接受培训。因此， $train$ 和 $innate ext{能力}$ 负相关。 \text{Corr}(x1, x2)< 0（-）。
结果： $(+)(-)=(-)$ 。结论：估计的 $𝛼_ ilde{1}$ 将严重低估培训程序的实际有效性。