Skip to main content

随机变量的数字特征

数学期望和方差

离散型

P{X=xk},k=1,2P\{X=x_{k}\},k=1,2\cdots 的数学期望为级数 k=1+xkpk\sum_{k=1}^{+\infty}x_{k}p_{k},若该级数 绝对收敛,则称其为随机变量 XX数学期望 或者 均值,记作 E(x)E(x).

若存在函数 g(x)g(x) 映射 xkx_{k},则随机变量 Y=g(X)Y=g(X) 的数学期望为

E(Y)=E[g(X)]=i=1ng(x)piE(Y)=E[g(X)]=\sum_{i=1}^n g(x)p_{i}

对于二维的随机变量

E(Z)=E[g(X,Y)]=i=1nj=1ng(xi,yj)pijE(Z)=E[g(X,Y)]=\sum _{i=1}^n\sum_{j=1}^ng(x_{i},y_{j})p_{ij}
info

期望和方差都要求(级数、积分)绝对收敛。

若数学期望 E{[XE(X)]2}E\{[X-E(X)]^2\} 存在,则称其为 XX方差,记作 D(X)D(X),即

D(X)=E{[XE(X)]2}D(X)=E\{[X-E(X)]^2\}

其开平方称为 标准差 或者 均方差,记作 σ(X)\sigma(X).

caution

随机变量是常数可以推出方差为 0,但是方差为 0,不能推出随机变量为常数。

方差如下性质:

  1. D(aX+b)=a2D(X)D(aX+b)=a^2D(X)
  2. 若随机变量相互独立,则 D(X±Y)=D(X)+D(Y)D(X\pm Y)=D(X)+D(Y)
tip

这里如果不相互独立就是协方差了。

方差的计算公式

D(X)=E{[XE(X)]2}=E{X22XE(X)+[E(X)]2}=E(X2)2E(X)E(X)+[E(X)]2=E(X2)[E(X)]2\begin{aligned} D(X)&= E\{[X-E(X)]^2\}\\ &=E\{X^2-2XE(X)+[E(X)]^2\}\\ &=E(X^2)-2E(X)E(X)+[E(X)]^2\\ &=E(X^2)-[E(X)]^2 \end{aligned}

连续型

E(X)=+xf(x)dxE(X)=\int _{-\infty}^{+\infty}xf(x) \, dx E(Y)=E[g(X)]=+g(x)f(x)dxE(Y)=E[g(X)]=\int _{-\infty}^{+\infty}g(x)f(x) \, dx E(Z)=E[g(X,Y)]=++g(x,y)f(x,y)dxdyE(Z)=E[g(X,Y)]=\int _{-\infty}^{+\infty} \, \int _{-\infty}^{+\infty} \, g(x,y)f(x,y)dxdy D(X)=[xE(x)]2f(x)dxD(X)=\int [x-E(x)]^2 f(x) \, dx

矩、协方差、相关系数

对于随机变量 XX,若

E(Xk),k=1,2,E(X^k),k=1,2,\cdots

存在,则称其为 XXk 阶原点矩

E{[XE(X)]k},k=1,2,E\{[X-E(X)]^k\},k=1,2,\cdots

存在,则称其为 XXk 阶中心矩

对于两个随机变量 X,YX,Y,若

E(XkYl),k,l=1,2,E(X^kY^l),k,l=1,2,\cdots

存在,则称其为 X,YX,Yk+l 阶混合矩

E{[XE(X)]k[YE(Y)]l},k,l=1,2,E\{[X-E(X)]^k[Y-E(Y)]^l\},k,l=1,2,\cdots

存在,则称之为 X,YX, Yk+l 阶混合中心矩

协方差:对于随机变量 X,YX,Y,若 E{[XE(X)][YE(Y)]}E\{[X-E(X)][Y-E(Y)]\} 存在,则称之为 X,YX,Y 的协方差,记作 Conv(X,Y)Conv(X,Y),即

Cov(X,Y)=E{[XE(X)][YE(Y)]}=E(XY)E(X)E(Y)\begin{aligned} Cov(X,Y)&=E\{[X-E(X)][Y-E(Y)]\}\\ &=E(XY)-E(X)E(Y) \end{aligned}

Cov(X,X)=E(X2)[E(X)]2=D(X)Cov(X,X)=E(X^2)-[E(X)]^2=D(X)

协方差的一些性质:

  1. D(X±Y)=D(X)+D(Y)±2Cov(X,Y)D(X\pm Y)=D(X)+D(Y)\pm 2Cov(X,Y)
  2. Cov(X,Y)=Cov(Y,X)Cov(X,Y)=Cov(Y,X)
  3. Cov(aX,bY)=abCov(X,Y)Cov(aX,bY)=abCov(X,Y)
  4. Cov(X1+X2,Y)=Cov(X1,Y)+Cov(X2,Y)Cov(X_{1}+X_{2},Y)=Cov(X_{1},Y)+Cov(X_{2},Y)

相关系数:对于随机变量 X,YX,Y,若 D(X)D(Y)0D(X)D(Y)\neq 0,则其相关系数为

ρXY=Cov(X,Y)D(X)D(Y)[1,1]\rho_{XY}= \frac{Cov(X,Y)}{\sqrt{D(X)D(Y)}}\in[-1,1]

若相关系数为 00,则说明 X 和 Y 不相关,其正负表明了随机变量是正相关还是负相关。

相关和独立

若随机变量相互独立,则其必不相关;若其不相关,不能说明其是否独立。

二维正态分布两随机变量相互独立的充分必要条件是 ρ=0\rho=0.

二维正态分布两随机变量相互独立与其不相关是等价的。

info

实际上协方差衡量是线性相关性,如果两随机变量线性相关,那么显然他们不是相互独立的;而两随机遍历不线性相关,不能说明其是否相互独立, 因为可能存在其他相关(非线性相关).