【计量经济学(十)】 时间序列数据
时间序列数据的$u$或许存在相关性,这个性质成为序列相关
关于误差项的三个问题
(1)误差项与自变量是否相关
(2)误差项方差是否相同
(3)是否序列相关
时间序列回归模型的例子
静态模型
$$
y_t=\beta_0+\beta_1z_t+u_t
$$
有限分布滞后模型
容许一个或多个变量对 $y$ 的影响有一定的时滞,例如:
$$
y_t=\alpha_0+\delta_0z_t+\delta_1z_{t-1}+\delta_2z_{t-2}+u_i
$$
如果冲击是暂时的,则只会影响一期:
$$
\frac{y_t}{z_{t-s}}=\delta_s
$$
如果冲击是永久的,则影响为:
$$
\delta_0+\delta_1+…+\delta_q
$$
有限样本性质
Assumption TS.1 线性于参数($Linear\ in\ parameters$)
$$
y_t=\beta_0+\beta_1 x_{t1}+\beta_2 x_{t2}+…+\beta_k x_{tk}+u_t
$$
Assumption TS.2 无完全共线性($No\ perfect\ collinearity$)
没有一个自变量是常数或是其他变量的完美线性组合
Assumption TS.3 零条件均值($Zero\ conditional\ mean$)
$$
E(u_t|X)=0
$$
$X$为一个矩阵,代表了所有时期的所有自变量,即$u_t$不受所有时间自变量影响。
为什么对于横截面数据只需要满足$E(u_t|X_t)=0$ ?
因为横截面数据满足随机抽样假设,该假设意味着:
1、$u_i$与其它样本的$X$不相关
2、$u_i$与其它样本的$u$不相关
而时间序列数据不满足随机抽样假设,即不满足“$u_i$与其它样本的$X$不相关”,需要更强的限制条件。
Theorem 10.1($Unbiasedness\ of\ OLS$)
在$TS.1-TS.3$下,我们有:
$$
E(\hat{\beta_j})=\beta_j
$$
Assumption TS.4 ($Homoscedasticity$)
$$
Var(u_t|X)=Var(u_t)=\sigma^2
$$
Assumption TS.5 无序列相关($No\ serial\ correlation$)
$$
Corr(u_t,u_s|X)=0,\ \ \ t\not =s
$$
为什么横截面数据没有这个假设?因为横截面数据为随机抽样。该假设对应了"$u_i$与其它样本的$u$不相关"。
Theorem 10.2 OLS的样本方差
在$TS.1-TS.5$下:
$$
Var(\hat{\beta_j}|X)=\frac{\sigma^2}{SST_j(1-R_j^2)}
$$
其中:
$$
SST_j=\sum_{i=1}^n(x_{ij}-\bar{x}_j)^2
$$
$R^2$是$x_j$对所有其他自变量进行回归得到的$R^2$
Theorem 10.3 方差无偏估计
在$TS.1-TS.5$下:
$$
E(\hat{\sigma}^2)=\sigma^2
$$
其中:
$$
\hat{\sigma^2}=\frac{SSR}{n-k-1}
$$
Theorem 10,4 高斯—马尔科夫定理
在$TS.1-TS.5$下,$OLS$估计值是方差最小的线性无偏估计值。
Assumption TS.6 正态性($Normality$)
$$
u_t \sim N(0,\sigma^2)
$$
时间趋势
线性时间趋势模型
$$
y_t=\alpha_0+\alpha_1t+e_t
$$
$e_t$是误差项,$t$代表时间,取值$1,2,…$
指数时间趋势模型
$$
log(y_t)=\alpha_0+\alpha_1t+e_t
$$
于是:
$$
\frac{\partial y_t/y_t}{\partial t}=a_1
$$
$\alpha_1$衡量了平均的增长率。
时间趋势的作用
如果有时间趋势的变量之间回归,可能会由于共同趋势而产生伪关系,因此我们需要进行除趋势($detrending$)
处理方法:
方法一:在回归中增加自变量 $t$。
$$
y_t=\beta_0+\beta_1x_{t1}+\beta_2 x_{t2}+\beta_3t+u_t
$$
方法二:
第一步:将$y_t,x_{t1},x_{t2}$分别对$t$回归,得到残差项$y_t’,x_{t1}‘,x_{t2}’$,例如:$y_t’=y_t-\hat{\alpha_0}-\hat{\alpha_1}t$
第二步:将$y_t’$对$x_{t1}'$和$x_{t2}$进行回归,得到的方程与方法一完全一致。
季节性模型
加入一系列的季节性变量。