大纲
第一部分:基础、数据与因果关系
第二部分:简单回归模型
第三部分:OLS 的统计性质
第四部分:多元回归模型 I
第五部分 A:多元回归模型 II - 方差与 BLUE
第五部分 B:统计推断 I
第六部分:统计推断 II(联合假设与 F 检验)
第七部分:进一步问题(大样本、函数形式、模型选择)
第一部分:基础、数据与因果关系
1.1 经验分析框架
计量经济学架起了抽象经济理论与现实非实验数据之间的桥梁。
经验分析的逻辑步骤:1. 提出一个精确的问题,例如:教育是否提高工资? 2. 指定一个经济模型:基于微观/宏观理论的基础关系,表示为 y=f(x<em>1,x</em>2,ext…,xk)。3. 制定计量经济模型:解决模糊性、定义功能形式并考虑不精确关系。 4. 统计推断:使用样本数据估计参数、构建置信区间并检验假设。
1.2 计量经济模型的解剖
经济模型表示准确关系。
计量经济模型必须考虑现实世界的变异性,使用随机误差项 u。
示例:教育回报模型 工资=𝛼<em>0+𝛼</em>1exteduc+𝛼2extexper+u。
组件的数学逻辑:- 参数 (𝛼<em>j):表示 x</em>j 对 y 的边际影响。 - 𝛼1=∂exteduc∂extwage(在其他因素固定的情况下)。 - 误差项 (u):捕捉 y 的所有未观察到的决定因素。在工资模型中,u 包括先天能力、家庭背景和运气。
1.3 因果关系与相关性以及其他条件
发现统计相关性是简单的,证明因果关系是计量经济学的核心目标。
“其他条件不变”条件:为了因果解释 𝛼<em>1,我们必须保持所有相关因素(包括 u)恒定。- △y=𝛼</em>1△x1+△u。
偏差的逻辑推导:如果我们想要真实的效果,我们需要 △u=0。
问题:如果研究变量 (x<em>1) 与未观察到的因素 (u) 相关,我们无法孤立 𝛼</em>1。
示例:如果我们观察出勤率和成绩,智力 (u) 影响二者。除非出勤率与 u 独立,否则相关性不等于因果关系。
练习 Q1:因果关系与内生性
练习 Q1:问题解答
缺陷(同时性/反向因果关系):市长假定增加警察会导致犯罪率上升。然而,自然高犯罪环境的城市(u 中的不可观察因素)响应地雇佣更多警察。
通过偏差解释正系数:𝛼<em>1ext大约等于𝛼</em>ext真+ext偏差。- 𝛼ext真:理论上更多警察应减少犯罪。 - ext偏差:高犯罪环境(u 升高)导致城市雇佣更多警察(警察数量上升)。 - ext影响(u):正向。较差的基础环境直接增加了犯罪率。
第二部分:简单回归模型
2.1 简单线性回归的逻辑
人口模型(未知的真相): y=𝛼<em>0+𝛼</em>1x+u。
关键假设:零条件均值 E(u∣x)=E(u)=0。- 不可观察的因素 u 必须与 x 的均值独立。这允许我们定义人口回归函数 (PRF):E(y∣x)=𝛼<em>0+𝛼</em>1x。
2.2 OLS 的数学推导
我们无法观察到真实的 𝛼<em>0,𝛼</em>1。我们通过样本 ig( (xi, yi)_{i=1}^n\big) 来估计它们。
最小二乘法原则(OLS):最小化残差平方和(SSR)。
数学推导:最小化 extSSR=extminimize<em>𝛼</em>0,𝛼<em>1(rac1n∑</em>i=1n(y<em>i−𝛼</em>0−𝛼<em>1x</em>i)2)。
一阶条件(FOCs):取偏导数置于 0。- ∂𝛼<em>0∂∑</em>iu<em>i=0(残差和为零)。 - ∂𝛼</em>1∂∑<em>ix</em>iui=0(残差与 x 不相关)。
2.3 OLS 估计公式推导
从 FOC(1)出发,除以 n 得到截距估计量:- OLS 截距估计量:𝛼<em>0=yˉ−𝛼</em>1xˉ。 - 代入 𝛼<em>0 于 FOC(2):∑</em>ix<em>i[y</em>i−(yˉ−𝛼<em>1xˉ)−𝛼</em>1xi]=0。
通过求和代数属性,我们获得精确的 OLS 斜率估计量:- OLS 斜率估计量:𝛼<em>1=∑<em>i(x</em>i−xˉ)2∑</em>i(x<em>i−xˉ)(y</em>i−yˉ)=Var(x)Cov(x,y)。
2.4 拟合优度 (R²)
样本回归线的拟合程度(y~<em>i=𝛼</em>0+𝛼<em>1x</em>i)有多好?- 方差分解:SST = SSE + SSR - SST(总平方和): ∑(y<em>i−yˉ)2 - SSE(解释平方和): ∑(y~</em>i−yˉ)2 - SSR(残差平方和): ∑(ui2)。
R 平方 (R²):因变量总变异的分数由自变量解释。- R2=SSTSSE=1−SSTSSR(0≤R2≤1)。
陷阱:较低的 R² 不一定意味着模型无用,较高的 R² 也不证明因果关系!它只测量线性拟合。
2.5 函数形式(对数)
模型与解释:
依赖变量 | 自变量 | 𝛼1 的解释 |
|---|
Level-Level | y | △y=𝛼1△x |
Level-Log | y | △y→100𝛼1△x |
Log-Level | log(y) | △y→(100𝛼1)△x |
Log-Log | log(y) | △y→𝛼1△x |
练习 Q2:OLS 属性与函数形式
A 问题:使用一阶条件证明 OLS 样本回归线总是正好通过样本平均 (\bar{x}, \bar{y})。
B 问题:一个研究者估计 CEO 工资和公司销售额的常数弹性模型 log(工资)=4.822+0.257log(销售),R² = 0.95。 - a) 如果公司销售额增加 10%,预计 CEO 工资变化百分比是多少? - b) R² = 0.95 是否保证公司销售额严格导致 CEO 工资?
练习 Q2:问题解答
答案:开始于 FOC:∑(y<em>i−𝛼</em>0−𝛼<em>1x</em>i)=0,分配求和:∑y<em>i−n𝛼</em>0−𝛼<em>1∑x</em>i=0。整体方程除以 n:yˉ=𝛼<em>0+𝛼</em>1xˉ,意味着 yˉ−𝛼<em>0−𝛼</em>1xˉ=0。
答案:1. 这是一个对数-对数模型。系数 0.257 是弹性。如果销售额增长 10%,则工资增长 10% × 0.257 = 2.57%。2. 不是。R² 仅测量解释的方差(相关性),而不测量因果关系。未观察到的因素 (u),如 CEO 任期或公司行业,可能同时驱动这两个变量。
第三部分:OLS 的统计性质
3.1 第三周的核心逻辑
基本观点:由于我们的数据 ((x<em>i,y</em>i)<em>i=1n) 是从随机样本中抽取的,因此 OLS 估计量 𝛼</em>0 和 𝛼1 是从随机数据计算得出的。
两个关键问题用于评估估计量: 1. 中心趋势:估计量是否平均击中真实人口参数?(E(𝛽<em>1) 怎么样?) 2. 离散度:这些估计在不同随机样本中有多大波动?(Var(𝛽</em>1) 怎么样?)
3.2 简单回归的五个假设
为了建立 OLS 的统计性质,我们依赖于高斯-马尔可夫假设:
SLR.1(参数线性):人口模型为 y=𝛼<em>0+𝛼</em>1x+u。
SLR.2(随机抽样):我们有一个大小为 n 的随机样本。
SLR.3(样本中 x 的变异):样本结果在 x 上不是完全相同的(SST_x > 0)。
SLR.4(零条件均值):E(u∣x)=0。
SLR.5(同方差性):extVar(u∣x)=σ2。随着 x 的变化,误差的方差是常数。
假设 SLR.1 到 SLR.4 是证明无偏性所需的充分条件。加入 SLR.5 使我们能够计算 OLS 的方差。
3.3 数学推导:无偏性(第 1 部分)
定理 2.1:E(β<em>1)=β</em>1。步骤 1:将 β<em>1 表述为真实的 β</em>1 和误差 u。回忆 OLS 公式:β<em>1=SST</em>x∑(x</em>i−xˉ)y<em>i。
步骤 2:将真实的人口模型 y<em>i=𝛼</em>0+𝛼<em>1x</em>i+u<em>i 代入:β</em>1=SST</em>x∑(x<em>i−xˉ)(𝛼</em>0+𝛼<em>1x</em>i+u<em>i)。- 使用求和代数(∑(x<em>i−xˉ)=0 和 ∑(x</em>i−xˉ)x<em>i=SST</em>x),𝛼<em>0 项消失,𝛼</em>1 项简化为 β<em>1:β</em>1=β<em>1+σ2SST</em>x∑(x</em>i−xˉ)u<em>i。
步骤 3:把期望值取样本条件关于 X。E(β<em>1∣X)=E(β</em>1+X∑w<em>iu</em>i)。- 因为 β<em>1 是常数,而 w</em>i 在条件上看作常数:E(β<em>1∣X)=β</em>1+∑w<em>iE(u</em>i∣x<em>i)。根据 SLR.4(E(u</em>i∣x<em>i)=0),第二项整体消失,得到仍然是 𝛼</em>1。
OLS 的无偏性解释:E(β<em>1)=β</em>1。
3.4 数学推导:OLS 方差
β1 在样本间波动的程度?
我们计算 extVar(β<em>1∣X)。从我们之前的分解开始: β</em>1=β<em>1+∑w</em>iui。
extVar(β<em>1∣X)=extVar(β</em>1+∑w<em>iu</em>i∣X)=∑w<em>i2extVar(u</em>i∣xi)。
应用 SLR.5(同方差性):extVar(u∣x<em>i)=σ2,因此 extVar(β</em>1∣X)=σ2∑w<em>i2=SST</em>xσ2=n∑(xi−xˉ)2σ2。
练习 Q3:OLS 方差(问题)
问题:一名研究者正在调查学习小时数 ($x$) 对考试成绩 ($y$) 的影响。她意识到她需要更精确的 β<em>1 估计(即,她想减少 extVar(β</em>1))。基于公式 extVar(β<em>1)=σ2[n∑(x</em>i−xˉ)2],列出两种不同方式来改变她的采样设计以减少 OLS 估计器的方差。
练习 Q3:问题解答
练习问题 Q4:无偏性与残差
练习问题 Q4:答案解答
错误。∑ui=0 是 OLS 计算算法在任何给定样本中强制为真的纯数学/代数属性。
无偏性 E[β]=β 是关于总体和样本过程的统计属性。它严格要求假设 SLR.4(E(u∣x)=0)。如果你遗漏了某个变量(导致内生性),SLR.4 失败。OLS 仍然可以计算出一个残差和为零的线,但结果 β1 将会存在系统偏差!
第四部分:多元回归模型 I
4.1 多元回归的逻辑
为什么要超越简单线性回归?1. 解决内生性:在简单回归中,未观察到的因素被放入 u 中。如果它们与 x 相关,β1 是偏差的。 2. 更好的因果推断:通过控件减少混杂因素,我们更接近真实的“其他条件不变”效应。 3. 灵活的函数形式:使用多项式(例如,inc 和 inc2)允许非线性关系。
多元线性回归(MLR)模型:y=β<em>0+𝛼</em>1x<em>1+𝛼</em>2x<em>2+…+β</em>kx<em>k+u。- β</em>1 衡量在固定 x<em>2,…,x</em>k 和 u 的情况下,y 预期变化的变化,给定 x1 增加 1 个单位。
4.2 遗漏变量偏差(OVB):推导
如果我们遗漏一个相关变量会发生什么?- 真实模型:y=β<em>0+𝛼</em>1x<em>1+𝛼</em>2x<em>2+u。 - 估计(不足规格)模型: ildey=β</em>ilde0+𝛼ilde1x<em>1。 - 偏差数学推导:来源于简单回归:{𝛼 ilde{1} = \frac{\sum{i}(x{i1} - \bar{x}1) yi}{(x{i1} - \bar{x}1)^2} 。替换真实模型 yi。
偏差公式: E(𝛼ilde1)=𝛼<em>1+𝛼</em>2𝜖<em>1~,其中 𝜖</em>1~ 是 x<em>2 关于 x</em>1 的回归斜率。
4.3 解读 OVB 的方向
偏差等式:Bias(𝛼ilde1)=E(𝛼ilde1)−𝛼<em>1=𝛼</em>2𝜖1~。
偏差的方向取决于两个因素:1. β<em>2:遗漏变量对 y 的真实影响。 2. 𝜖</em>1~:x<em>1 和 x</em>2 的相关性。
当 \text{Corr}(x1, x2) > 0,Bias(𝛼ilde1) 存在上升偏见。 - 当 \text{Corr}(x1, x2) < 0 ,Bias(𝛼ilde1) 存在下降偏见。
直观理解:如果 x<em>1 和 x</em>2 一同移动,而 x<em>2 提高 y,忽略 x</em>2 会迫使 𝛼ilde1 为 x<em>2 的效果“背书”,使 𝛼</em>ilde1 人为增大。
练习 Q5:添加变量与 R²
问题:你对学习小时的简单回归进行回归。然后你决定添加鞋子尺寸作为第二个自变量。 是 R² 增加还是减少?包括一个无关变量会使 βext学习 变偏吗?
练习 Q5:练习解答
解析解决方案:- 1. R² 行为:添加自变量时,R² 绝不会减少,即使它完全无关(如鞋子尺寸)。它只会保持完全不变(如果估计的系数正好为零),或者略微增加由于随机机会的拟合。 - 2. 无偏性:包括不相关的变量(β<em>ext鞋=0)被称为“过度指定模型”。这不会导致偏倚 (E[β</em>ext学习]=βext学习)。但它浪费了自由度,可能人为地膨胀了你估计的方差。
4.5 R² 为什么永远不会减少
为何在添加变量时,SSR 下降尽可能的(至少不会增加)。
你的直觉完全正确:为OLS回归添加自变量总是会导致残差平方和 (SSR) 下降(或至多保持完全不变)。
供了解释,其数学证明:当 OLS 估计未约束模型时,算法是否能寻找 B 的绝对最小平方值的二次形式的目标。
练习 Q6:评估 OVB 方向
练习 Q6:问题解答
β<em>2 的符号:先天能力逻辑上提高生产力,因此 β2 > 0(+)。
相关性的符号:低能力工人接受培训。因此,train 和 innateext能力 负相关。 \text{Corr}(x1, x2)< 0(-)。
结果:(+)(−)=(−)。结论:估计的 𝛼ilde1 将严重低估培训程序的实际有效性。