常见的概率分布

阅读量：5905 次

发布时间：2019-06-19

本文共 4403 字，大约阅读时间需要 14 分钟。

离散分布

0-1分布(伯努利分布)

它的分布律为：

\[P\{X=k\}=p^k(1-p)^{1-k}, k=0,1, (0<p<1)\]

0-1分布记作：\(X \sim b(1,p)\)

期望：\(E(X)=p\)

方差:\(D(X)=p(1-p)\)

常用的场景：新生婴儿性别的登记，招生考试的录取，产品的是否合格，硬币的正反面。

二项分布

二项分布为\(n\)重伯努利实验的概率分布。

分布律为：

\[P\{X=k\}=\begin{pmatrix}

n\\

\end{pmatrix}p^k(1-p)^{n-k},k=0,1,2,...,n,(0<p<1)\]

\[\sum\limits_{k=0}^{n}P\{X=k\}=\sum\limits_{k=0}^{n}\begin{pmatrix}

n\\

\end{pmatrix}p^k(1-p)^{n-k}=(p+1-p)^n=1\]

二项分布记作：\( X \sim b(n,p)\)

期望：\(E(X)=np\)

方差:\(D(X)=np(1-p)\)

常用的场景：比如一个人射击\(n\)次，其中\(k\)次命中的概率，抽查50台设备，其中10台出故障的概率等等。

从下面的图中，我们可以看到命中次数先增加，到了3达到最大，之后又逐渐减少，一般来说，对于固定的\(n,p\)，都具有这一性质。

（1）当\(（n+1）p\)不为整数时，二项概率\(P\{X=k\}\)在\(k=[(n+1)p]\)时达到最大值；

（2）当\(（n+1）p\)为整数时，二项概率\(P\{X=k\}\)在\(k=(n+1)p,k=(n+1)p-1\)时达到最大值。

%每轮射击10次，命中概率0.3，射击10000轮，x中返回的是每轮中命中的次数x=binornd(10,0.3,10000,1);%bin的数目为10hist(x,10);

N=100;p=0.4;k=0:N;%事件发生k次的概率pdf=binopdf(k,N,p);%事件发生不大于k次的概率cdf=binocdf(k,N,p);plotyy(k,pdf,k,cdf);grid on;

多项分布

多项式分布是二项式分布的扩展，在多项式分布所代表的实验中，一次实验会有多个互斥结果，而二项式分布所代表的实验中，一次实验只有两个互斥结果。

把二项扩展为多项就得到了多项分布。比如扔骰子，不同于扔硬币，骰子有6个面对应6个不同的点数，这样单次每个点数朝上的概率都是1/6（对应p1~p6，它们的值不一定都是1/6，只要和为1且互斥即可，比如一个形状不规则的骰子），重复扔n次，如果问有x次都是点数6朝上的概率就是：

\[C_n^xp^x(1-p)^{n-x}\]

更一般性的问题会问：点数1~6的出现次数分别为(x1,x2,x3,x4,x5,x6)时的概率是多少？其中sum(x1~x6）= n。这就是一个多项式分布问题。这时只需用上边公式思想累乘约减就会得到下面的概率公式

某随机实验如果有\(k\)个可能结局\(A_1,A_2,…,A_k\)，分别将他们的出现次数记为随机变量\(X_1,X_2,…,X_k\)，它们的概率分布分别是\(p_1,p_2,…,p_k\)，那么在\(n\)次采样的总结果中，\(A_1\)出现\(n_1\)次、\(A_2\)出现\(n_2\)次、…、\(A_k\)出现\(n_k\)次的这种事件的出现概率P有下面公式：

\[P(X_1=n_1,...,X_k=n_k)=\left\{\begin{matrix}\frac{n!}{n_1!...n_k!}p_1^{n_1}...p_k^{n_k}, \sum\limits_{i=1}^kn_i=n\\ 0, others\end{matrix}\right.\]

用另一种形式写为：

\[P(X_1=n_1,...,X_k=n_k)=\left\{\begin{matrix} n!\prod\limits_{i=1}^k\frac{p_i^{n_i}}{n_i!}, \sum\limits_{i=1}^kn_i=n\\ 0, others\end{matrix}\right.\]

其中\(\sum\limits_{i=1}^{k}p_i=1\) 。

期望: 设r维随机变量\((x_1,x_2,⋯,x_r)\)服从多项分布，则数学期望是

\[E(x_1,x_2,⋯,x_n)=(np_1,np_2,⋯,np_r)\]

方差：\(Var(x_i)=np_i(1−p_i)，i=1,2,⋯,r\)

泊松分布

概率分布为：

\[P\{X=k\}=\frac{\lambda^ke^{-\lambda}}{k!},k=0,1,2,...,\lambda>0\]

泊松分布记作：\(X \sim \pi(\lambda)\)

\[\sum\limits_{k=0}^{\infty}P\{X=k\}=\sum\limits_{k=0}^{\infty}\frac{\lambda^ke^{-\lambda}}{k!}=e^{-\lambda}e^\lambda=1,k=0,1,2,...,\lambda>0\]

期望：\(E(X)=\lambda\)

方差:\(D(X)=\lambda\)

常用场景：一天内网站的访问量，某段时间内发生的交通事故等等。泊松分布适合于描述单位时间（或空间）内随机事件发生的次数。

对于二项分布，如果\(np_n=\lambda\).可以用泊松分布来近似二项分布。

下面的代码画出泊松分布的概率密度图和分布图。

x=0:1:20;%lambda=5,泊松概率密度y=poisspdf(x,5);plot(x,y);%lambda=5,泊松概率分布y1=poisscdf(x,5);figure;plot(x,y1);

负二项分布(帕斯卡分布)

进行重复试验时，直到某个事件出现了\(r\)次时停止试验，此时试验进行次数\(X\)服从负二项分布，为二项分布的变体，注意到最后一次一定是成功的，所以是\(C_{k-1}^{r-1}\)而不是\(C_k^r\)

概率分布为：

\[P\{X=k\}=C_{k-1}^{r-1}p^r(1-p)^{k-r},k=r+1,r+2,...,n,(0<p<1)\]

负二项分布记作：\( X \sim b_0(r,p)\)

期望：\(E(X)=\frac{r}{p}\)

方差:\(D(X)=\frac{r(1-p)}{p^2}\)

常用的场景：比如抽查20台设备，如果出现3次失败就停止抽查，全面停工。

几何分布

负二项分布中，r=1时的特殊情况，即第1次试验成功时，试验进行的次数X的分布。

概率分布为：

\[P\{X=k\}=p(1-p)^k,k=0,1,...,n,(0<p<1)\]

负二项分布记作：\( X \sim b_0(r,p)\)

期望：\(E(X)=\frac{1}{p}\)

方差:\(D(X)=\frac{(1-p)}{p^2}\)

常用的场景：比如抽查20台设备，如果设备故障，立即停工检修。

超几何分布

to do

单点分布(退化分布)

随机变量取a时，概率为1。

记作： \(b_0(a,1)\)

单点分布记作：\(p(x=a)=1\)

期望：a

方差：0

连续分布

均匀分布

随机变量的概率密度在[a,b]区间上为常数\(\frac{1}{b-a}\)，则此随机变量服从均匀分布，意为在某个区间内各取值是等可能的，概率的大小只与长度有关。

均匀分布概率密度函数：

\[f(x)=\left\{\begin{matrix}

\frac{1}{b-a}, a<x<b\\

0, others

\end{matrix}\right.\]

均匀分布分布函数：

\[F(x)=\left\{\begin{matrix} 0, x<a\\

\frac{x-a}{b-a}, a \leq x<b\\

1, x \geq b

\end{matrix}\right.\]

均匀分布记作: \( U(a,b)\)

期望:\(E(X)=\frac{(a+b)}{2}\)

方差：\(D(X)=\frac{(b-a)^2}{12}\)

正态分布(高斯分布)

指数分布

为伽玛分布的特殊形式，即当\(\alpha=1\)时的伽玛分布。

均匀分布概率密度函数：

\[f(x)=\left\{\begin{matrix}

\frac{1}{\theta}e^{-x/\theta}, x>0\\

0, others

\end{matrix}\right.\]

均匀分布分布函数：

\[F(x)=\left\{\begin{matrix} 1-e^{-x/\theta}, x>0\\

0, others

\end{matrix}\right.\]

均匀分布记作: \(\Gamma(a,b)\)

期望:\(E(X)=\theta\)

方差：\(D(X)=\theta^2\)

指数函数的一个重要特征是无记忆性（Memoryless Property，又称遗失记忆性）。这表示如果一个随机变量呈指数分布，当\(s,t>0\)时有\(P(T>t+s|T>t)=P(T>s)\)。即，如果\(T\)是某一元件的寿命，已知元件使用了\(t\)小时，它总共使用至少\(s+t\)小时的条件概率，与从开始使用时算起它使用至少\(s\)小时的概率相等。

用下面的代码，我们可以画出指数分布的概率密度函数和分布函数图：

x=0:0.1:5;plot(x,[gampdf(x,1,0.3);gampdf(x,1,1);gampdf(x,1,2)]);legend('theta=0.3','theta=1','theta=2');grid on;figure;plot(x,[gamcdf(x,1,0.3);gamcdf(x,1,1);gamcdf(x,1,2)]);legend('theta=0.3','theta=1','theta=2');grid on;