度量单位与函数形式
半对数形式
logy=β0+β1x+u
两边对x求导:
∂x∂logy=β1
y1∗∂x∂y=β1
yΔy=β1Δx
故β1表示x每增加一个单位,$ y $就会增加100β1%
全对数模型(常弹性模型)
logy=β0+β1logx+u
同理,对x求导可得:
yΔy=β1xΔx
故β1表示x变化百分之一引起y变化百分之β1
对"线性"回归的理解
线性回归并非要求x与y之间存在线性关系,关键在于方程中的参数β0与β1是线性的。
OLS估计量的期望值与方差
OLS的无偏性
估计量β1^、β0^是随机变量,而非常数,会随着样本的改变而改变。从数据生成的角度来说,β0、β1是固有的,而x、u是随机产生的,由这些变量再确定y的值,故本质上β1^、β0^β1^、β0^的随机性来自于x与u。随机产生的x,y 构成了总体,我们通过抽样进行估计,不同的样本会产生不同的估计值。
既然是随机变量,就存在期望值与方差。无偏性指的是:
E(β1^)=β1E(β0^)=β0
其证明的前提是需要满足四个假设:
假定MLR.1MLR.1 (线性于参数)
即在总体模型中,变量满足线性关系式:
y=β0+β1x+u
假定MLR.2MLR.2(随机抽样)
我们假定拥有一个服从总体模型方程的随机样本,其样本容量为n,即:
{(xi,yi):i=1...n}
yi=β0+β1xi+ui
随机抽样暗示着 ui 之间是不相关的。
目前我们研究的是横截面数据,故ui不相关是大概率满足的,而后续对时间序列分析时就不一定满足。
假定MLR.3MLR.3 (解释变量的样本有变动)
我们要求xi不是完全相同的数值,等价于:
i=1∑n(xi−xˉ)2>0
这是一个很弱的条件,其目的在于后续分母不为零。
假定MLR.4MLR.4 (零条件均值)
对于给定解释变量的任何值,误差的期望值都为零。换言之,
E(u∣x)=0
理解假设4:近似于要求u与x无关,因为在不同x的情况下,u的均值不发生变化(这与u的分布不变有一定差距,故只是近似无关)
无偏性证明如下:
β1^=∑i=1n(xi−xˉ)2∑i=1n(xi−xˉ)yi(1)
根据MLR.1和MLR.2:
yi=β0+β1xi+ui(2)
将(2)代入(1)得:
β1^=∑i=1n(xi−xˉ)2∑i=1n(xi−xˉ)(β0+β1xi+ui)(3)
=∑i=1n(xi−xˉ)2β0∑i=1n(xi−xˉ)+β1∑i=1nxi(xi−xˉ)+∑i=1nui(xi−xˉ)
而已知:
i=1∑n(xi−xˉ)=0
i=1∑nxi(xi−xˉ)=i=1∑n(xi−xˉ)2
故:
β1^=β1+∑i=1n(xi−xˉ)2∑i=1nui(xi−xˉ)β1^=β1+∑i=1n(xi−xˉ)2∑i=1nui(xi−xˉ)
以 $ x $ 的值作为固定条件,那么估计值的随机性则完全来自于误差项。于是有:
E(β^1∣xi)=β1+E(∑i=1n(xi−xˉ)2∑i=1nui(xi−xˉ)∣xi)=β1+∑i=1n(xi−xˉ)21E(i=1∑nui(xi−xˉ)∣xi)=β1+∑i=1n(xi−xˉ)21i=1∑n(xi−xˉ)E(ui∣xi)
根据$ MLR.4 $
E(ui∣xi)=0
故:
∑i=1n(xi−xˉ)2∑i=1nui(xi−xˉ)=0
E[ β1^]=β1E[ β1^]=β1
得证。
值得注意的是,估计量的无偏性需要满足以上4个假设条件,现实中可能未必均能满足。例如假设4,在现实的很多情况中x与u可能存在一定的相关性,这会导致回归结果的错误。