条件期望

离散条件下的条件期望

在给定事件BBP(B)>0P(B)>0)的条件下,事件AA发生的条件概率为

P(AB)=P(AB)P(B)P(A|B)=\frac{P(AB)}{P(B)}

显然:

P(AB)=P(A)    当且仅当A,B相互独立P(A|B)=P(A) \ \ \ \ 当且仅当A,B相互独立

P(B)>0P(B)>0,定义给定事件BB的条件下,随机变量XX的条件分布函数为:

FX(xB)=P(Xx,B)P(B)F_X(x|B)=\frac{P(X\leq x,B)}{P(B)}

同样,在给定BB的条件下,XX的条件期望为:

E(XB)=E(XIB)P(B)E(X|B)=\frac{E(XI_B)}{P(B)}

其中,IBI_B 是示性函数:

IB(ω)={1,ωB0,ωBI_B(\omega)=\begin{cases} 1,\omega \in B \\ 0,\omega \notin B \end{cases}

XX为离散型随机变量,则:

E[XB]=k=1xkP({x=xk}B)P(B)=k=1xkP(x=xkB)E[X|B]=\sum_{k=1}^{\infty} x_k\frac{P(\{x=x_k\} \cap B) }{P(B)}=\sum_{k=1}^{\infty} x_k P(x=x_k|B)

XX为具有密度fXf_X的随机变量,则:

E[XB]=1P(B)xIB(x)fX(x) dx=1P(B)BxfX(x) dxE[X|B]=\frac{1}{P(B)}\int_{-\infty}^{\infty} xI_B(x)f_X(x)\ dx=\frac{1}{P(B)}\int_{B}xf_X(x)\ dx

例1

均匀分布的随机变量的条件期望。样本空间Ω=[0,1]\Omega=[0,1],其上的概率测度PP满足P([a,b])=baP([a,b])=b-a,显然,XX服从[0,1][0,1]上的均匀分布

条件期望的性质

1、线性:

E[[C1X1+C2X2]Y]=C1E[X1Y]+C2E[X2Y]E[[C_1X_1+C_2X_2]|Y]=C_1E[X_1|Y]+C_2E[X_2|Y]

2、重期望公式:

E[X]=E[E[XY]]E[X]=E[E[X|Y]]

​ 整体的平均等于部分的平均再平均,其中部分平均E[XY]E[X|Y]是随机变量

证明:

E[E[XY]]=i=1E[XAi]P(Ai)=i=1E[XIAi]P(Ai)P(Ai)=i=1E[XIAi]=E[Xi=1IAi]=E[X]E[E[X|Y]]=\sum_{i=1}^{\infty}E[X|A_i]P(A_i) \\ =\sum_{i=1}^{\infty} \frac{E[XI_{A_i}]}{P(A_i)} P(A_i) \\ =\sum_{i=1}^{\infty}E[XI_{A_i}]\\ =E[X\sum_{i=1}^{\infty}I_{A_i}]=E[X]

注意,最后一步用到了:

i=1IAi=Ii=1Ai=IΩ=1\sum_{i=1}^{\infty}I_{A_i}=I_{\cup_{i=1}^{\infty}A_i}=I_{\Omega} =1

3、如果XXYY独立,则

E[XY]=E[X]E[X|Y]=E[X]

证明:

P(XA,Y=yi)=P(XA)P(Ai)P(X \in A,Y=y_i)=P(X\in A)P(A_i)

Ai={ω:IAi(ω)=1}={ω:Y(ω)=yi}A_i=\{\omega: I_{A_i}(\omega)=1 \}=\{\omega:Y(\omega)=y_i \}

故:

P(XA,IAi=1)=P(XA)P(IAi=1)P(X\in A,I_{A_i}=1) =P(X\in A)P(I_{A_i}=1)

同理将IAi=0I_{A_i}=0代入也成立,故随机变量XXIAiI_{A_i}也独立

E[XY](ω)=E[XAi]=E[XIAi]P(Ai)=E[X]E[IAi]P(Ai)=E[X]P(Ai)P(Ai)=E[X]E[X|Y](\omega)=E[X|A_i]=\frac{E[XI_{A_i}]}{P(A_i)}=\frac{E[X]E[I_{A_i}]}{P(A_i)}=\frac{E[X]P(A_i)}{P(A_i)} =E[X]

故:

E[X]=E[XY]E[X]=E[X|Y]

4、条件期望E[XY]E[X|Y]不是XX的函数,而是YY的函数,随机变量XX只是决定了这个函数的类型:

E[XY]=g(Y)E[X|Y]=g(Y)

其中:

g(y)=i=1E[XY=yi] I{yi}(y)g(y)=\sum_{i=1}^{\infty} E[X|Y=y_i]\ I_{\{y_i\}}(y)

关于$\sigma $域

随机过程的$\sigma $域

对于随机过程Y={Yt,tT,ωΩ}Y=\{Y_t,t\in T ,\omega\in \Omega \},记σ(Y)\sigma(Y)为包含以下集合的最小代数{ω:样本轨道(Yt(ω),tT)属于C}\{\omega:样本轨道(Y_t{(\omega)},t\in T)属于C \},其中CC是由TT上的函数组成的任意一个恰当的集合,则称σ(Y)\sigma(Y)为由YY生成的σ\sigma代数。

一般条件期望

对于给定的σ\sigmaFF,如果随机变量ZZ满足如下条件:

1、ZZ中的信息不比FF中的信息多,即:σ(Z)F\sigma(Z) \subset F

2、对任意的A FA\ \in F,有:

E(XIA)=E(ZIA)E(XI_A)=E(ZI_A)

则称随机变量ZZXX在给定的σ\sigmaFF下的条件期望,记为 Z=E(XF)Z=E(X|F)

可以认为:条件期望E(XF)E(X|F)是对原来的随机变量XX的简略的概况。

条件期望的性质(运算法则)

法则11:线性性质

E([C1X1+C2X2]F)=C1E(X1F)+C2E(X2F)E([C_1X_1+C_2X_2]|F)=C_1E(X_1|F)+C_2E(X_2|F)

法则22

E(X)=E(E(XF))E(X)=E(E(X|F))

法则33:

​ 如果XXσ\sigmaFF是相互独立的,那么:E(XF)=E(X)E(X|F)=E(X)

​ 特别地,如果XXYY是相互独立的,那么:E(XY)=E(X)E(X|Y)=E(X)

​ 独立的理解:在已经知道了FF的情况下,仍然不能得到关于XX的更多的信息。

法则44:

​ 如果由随机变量XX生成的 σ\sigmaσ(X)\sigma(X) 包含在 FF 中(即 XX 关于 FF 可测),那么:

E(XF)=XE(X|F)=X

​ 特别地,若XXYY的函数,意味着 σ(X)σ(Y)\sigma(X) \subset \sigma(Y),则有:E(XY)=XE(X|Y)=X

​ 这意味着FF的信息可以提供关于XX的所有信息,故可将XX视为非随机来处理。

法则55:

​ 如果由随机变量XX生成的 σ\sigmaσ(X)\sigma(X) 包含在 FF 中(即 XX 关于 FF 可测),那么对任意随机变量GG,有:

E(XGF)=XE(GF)E(XG|F)=XE(G|F)

​ 若XXYY的函数,则:E(XGY)=XE(GY)E(XG|Y)=XE(G|Y)

法则66: 塔型法则

​ 如果FFFF'是两个σ\sigma域,满足FFF \subset F',则有:

E(XF)=E(E(XF)F)E(XF)=E(E(XF)F)E(X|F)=E(E(X|F')|F) \\ E(X|F)=E(E(X|F)|F')

法则77: 独立性引理

​ 若XXFF独立,YY关于FF可测,则:

E(h(X,Y)F)=E(h(X,y))y=YE(h(X,Y)|F)=E(h(X,y))|_{y=Y}

条件期望的投影性质

FF是一个σ\sigma域,L2(F)L^2(F)是由Ω\Omega上满足如下性质的随机变量ZZ构成的集合:

  • ZZ具有有限二阶距:E(Z2)<+E(Z^2)< + \infty
  • ZZ携带的信息包含在FF中:σ(Z)F\sigma(Z) \subset F,如果F=σ(Y)F=\sigma(Y),则意味着ZZYY的函数。

投影性质:

​ 设XX是随机变量,满足E(X2)<+E(X^2)<+\infty,则条件期望E(XF)E(X|F)L2(F)L^2(F)中在均方意义下最接近XX的随机变量,即:

E(XE(XF))2=minZL2(F)E(XZ)2E(X-E(X|F))^2=min_{Z\in L^2(F)} E(X-Z)^2

也可以理解为E(XF)E(X|F)是在给定FF下对XX最好的预测