Skip to main content

常用分布

常用分布

均匀分布

所有取值的概率相同,连续形式为

f(x)={1ba,a<x<b0f(x)=\begin{cases} \frac{1}{b-a}, a<x<b \\ 0 \end{cases}

其均值方差为 E(X)=a+b2,D(X)=(ba)212E(X)= \frac{a+b}{2},D(X) =\frac{(b-a)^2}{12}.

二项分布

0-1 分布:随机变量只能取两个值;

二项分布:满足分布率:

P{X=k}=Cnkpkqnk,k=0,1P\{X=k\}=C_{n}^kp^kq^{n-k},k=0,1\cdots

其中 q=1pq=1-p,记作 XB(n,p)X\sim B(n, p)n=1n=1 时,二项分布退化为 010-1 分布;

几何分布:满足分布率:

P{X=k}=pqk1,k=1,2P\{X=k\}=pq^{k-1},k=1,2\cdots
info

在伯努利试验中,在第 kk 次试验才首次成功的概率服从几何分布,即前面都失败,只有最后一次成功。

note

几何分布是帕斯卡分布 r=1r=1 时的特例,帕斯卡分布是负二项分布的正整数形式,描述第 nn 次成功发生在第 kk 次的概率。

超几何分布:满足分布率:

P{X=k}=CMkCNMnkCNn,k=l1,,l2P\{X=k\}=\frac{C_{M}^kC_{N-M}^{n-k}}{C_{N}^n}, k=l_{1},\cdots,l_{2}

其中 l1=max(0,nN+M)l_{1}=max(0,n-N+M)l2=min(M,n)l_{2}=min(M,n),则称其为服从参数 n,N,Mn,N,M 的超几何分布。

与几何分布不同,超几何分布是“不放回的”,相当于 NN 个产品中有 MM 个次品,取 nn 个,其中有 kk 个是次品。但若是有放回的,则随机变量服从 B(n,MN)B\left(n, \frac{M}{N} \right).

泊松分布

满足分布率:

P{X=k}=λkk!eλ,k=0,1P\{X=k\}=\frac{\lambda^k}{k!}e^{-\lambda}, k=0,1\cdots

其中 λ>0\lambda>0,记作 XP(λ)X\sim P(\lambda),一段时间电话总机接到呼叫次数、候车的旅客、保险索赔次数等都服从泊松分布。

指数分布

指数分布连续型随机变量 满足分布率:

f(x)={λeλx,x>00,x0,λ>0f(x)=\begin{cases} \lambda e^{-\lambda x},x>0\\ \\ 0 ,x\leq 0 \end{cases},\lambda>0

则称其服从参数为 λ\lambda 的指数分布,记作 XE(λ)X\sim E(\lambda) .

其累积分布函数:

F(x)={1eλx,x>00,x0,λ>0F(x)=\begin{cases} 1-e^{-\lambda x},x>0\\ \\ 0,x\leq 0 \end{cases} ,\lambda>0

性质

可以证明 P{X>t}=tλeλxdx=F()F(t)=eλxP\{X>t\}=\int_{t}^{\infty} \lambda e^{-\lambda x}\, dx=F(\infty)-F(t)=e^{-\lambda x}.

P{X>t+sX>s}=P{X>t+s}P{X>s}=eλxP\{X>t+s|X>s\}=\frac{P\{X>t+s\}}{P\{X>s\}}=e^{-\lambda x},此性质被称为指数分布的 无记忆性

正态分布

正态分布连续型随机变量 满足分布率:

f(x)=12πσe(xμ)22σ2,<x<f(x) = \frac{1}{\sqrt{2\pi}\sigma}e^{ -\frac{(x-\mu)^2}{2\sigma^2} }, -\infty<x<\infty

其中 μ\mu 表示均值,σ\sigma 表示标准差,则称 XN(μ,σ2)X\sim N(\mu,\sigma^2),若 XN(0,1)X\sim N(0,1),则称其服从标准正态分布 ϕ(x)=12πex22,<x<\phi(x)=\frac{1}{\sqrt{2\pi}}e^{ -\frac{x^2}{2} }, -\infty<x<\infty .

f(x)f(x) 关于 x=μx=\mu 对称,ϕ(x)\phi(x) 是偶函数。

其累积分布函数:

F(x)=12[1+erf(xμσ2)]=12πxe(tμ)22σ2dx\begin{aligned} F(x) &= \frac{1}{2}\left[1 + \mathrm{erf}\left(\frac{x-\mu}{\sigma \sqrt{2}}\right)\right]\\ &=\frac{1}{\sqrt{2\pi}}\int_{-\infty}^{x}e^{-\frac{(t-\mu)^2}{2\sigma^2}} \, dx \end{aligned}

这里的 erf\mathrm{erf} 表示高斯误差函数:

erf(x)=2π0xet2dt\mathrm{erf}(x) = \frac{2}{\sqrt{\pi}} \int_{0}^{x} e^{-t^2} dt

标准正态分布的累积分布函数:

Φ(x)=12πxet22\Phi (x)=\frac{1}{\sqrt{2\pi}}\int_{-\infty}^{x}e^{-\frac{t^2}{2}}

其与一般正态分布有着如下的转换公式

F(x)=Φ(xμσ)F(x)=\Phi\left( \frac{x-\mu}{\sigma} \right)

f(x)=k1Φ(xu1σ1)+k2(xμ2σ2)f(x)=k_{1}\Phi\left( \frac{x-u_{1}}{\sigma_{1}} \right)+k_{2}\left( \frac{x-\mu_{2}}{\sigma_{2}} \right),且 k1+k2=1k_{1}+k_{2}=1,则 EX=k1u1+k2u2EX=k_{1}u_{1}+k_{2}u_{2}.

XN(0,1)X\sim N(0,1),则 P{Xx}=2Φ(x)1P\{|X|\leq x\}=2\Phi(x)-1

note

以下的分布都是一些常用的统计抽样分布。

卡方分布

tip

卡方分布由多个相互独立标准正态分布的随机变量的平方之和引出。

对于 nn 个随机变量序列,XiN(0,1)X_{i}\sim N(0,1),则

X=i=1nXi2 X=\sum_{i=1}^nX_{i}^2

XX 的分布率为卡方分布,记作 Xχ2(n)X\sim \chi^2(n),其中参数 nn 被成为自由度。

其概率密度函数为

f(x)={12n2Γ(n2)xn21en2,x>00f(x)=\begin{cases} \frac{1}{2^{\frac{n}{2}}\Gamma\left( \frac{n}{2} \right)}x^{\frac{n}{2}-1}e^{-\frac{n}{2}}, x>0 \\ 0 \end{cases}

是一个非对称分布,当 nn 足够大时,趋向于正态分布。

t 分布

tip

标准正态分布 和卡方分布 根号 的商。

对于独立随机变量 XN(0,1),Yχ2(n)X\sim N(0,1), Y\sim\chi^2(n_{})

T=XY/nT= \frac{X}{\sqrt{ Y/n }}

则称 TT 为服从自由度为 nnTT 分布,记作 TT(n)T\sim T(n).

其概率密度函数为 偶函数,并且当 nn 充分大时,其分布近似于 标准正态分布

F 分布

tip

FF 分布是两个卡方分布的商。

对于两个服从卡方分布的独立随机变量 Xχ2(n1),Yχ2(n2)X\sim\chi^2(n_{1}), Y\sim\chi^2(n_{2})

F=X/n1Y/n2F= \frac{X/n_{1}}{Y/n_{2}}

则称 FF 为服从自由度为 (n1,n2)(n_{1},n_{2})FF 分布,记作 FF(n1,n2)F\sim F(n_{1},n_{2}),另有 1FF(n2,n1)\frac{1}{F}\sim F(n_{2},n_{1}).

其概率密度函数为

f(x)={Γ(n1+n22)Γ(n12)Γ(n22)n1n12n2n22xn112(n1x+n2)n1+n22,x>00f(x)=\begin{cases} \frac{\Gamma\left( \frac{n_{1}+n_{2}}{2} \right)}{\Gamma\left( \frac{n_{1}}{2} \right)\Gamma\left( \frac{n_{2}}{2} \right)}n_{1}^{\frac{n_{1}}{2}}n_{2}^{\frac{n_{2}}{2}} \frac{x \frac{n_{1}-1}{2}}{(n_{1}x+n_{2})^{\frac{n_{1}+n_{2}}{2}}},x>0\\ 0 \end{cases}

根据 t 分布的定义,可以发现 XT(n)X\sim T(n),则 X2χ(1,n)X^2\sim\chi(1, n).

期望方差

分布期望方差
均匀a+b2\frac{a+b}{2}(ba)212\frac{(b-a)^2}{12}
0-1ppp(1p)p(1-p)
二项npnpnp(1p)np(1-p)
几何1p\frac{1}{p}1pp\frac{1-p}{p}
泊松λ\lambdaλ\lambda
指数1λ\frac{1}{\lambda}1λ2\frac{1}{\lambda^2}
正态μ\muσ2\sigma^2
卡方nn2n2n
t00nn2\frac{n}{n-2}
Fn2n22\frac{n_{2}}{n_{2}-2}2n22(n1+n22)n1(n22)2(n24)\frac{2n_{2}^2(n_{1}+n_{2}-2)}{n_{1}(n_{2}-2)^2(n_{2}-4)}

分布可加性

info

可加性的首要前提是相互独立。

对于服从 二项分布 的随机变量 XB(n1,p),YB(n2,p)X\sim B(n_{1},p), Y\sim B(n_{2},p) ,则 X+YB(n1+n2,p)X+Y\sim B(n_{1}+n_{2},p).

对于服从 泊松分布 的随机变量 XP(λ1),YP(λ2)X\sim P(\lambda_{1}), Y\sim P(\lambda_{2}) ,则 X+YP(λ1+λ2)X+Y\sim P(\lambda_{1}+\lambda_{2}).

对于服从 卡方分布 的随机变量 Xχ2(n1),Yχ2(n2)X\sim \chi^2(n_{1}), Y\sim \chi^2(n_{2}) ,则 X+Yχ2(n1+n2)X+Y\sim \chi^2(n_{1}+n_{2}).

服从 正态分布 的随机变量的任意线性组合都可以,注意方差系数需要乘以平方,例如 X+YN(c1u1+c2u2,c12σ12+c22σ22)X+Y\sim N(c_{1}u_{1}+c_{2}u_{2},c_{1}^2\sigma^2_{1}+c_{2}^2\sigma^2_{2}).

指数分布不具有可加性,但是独立的指数分布求和服从 gamma 分布