说笑限于即兴,留下误会就成了谎言。
# 离散概率分布
# 伯努利试验
我们考虑最基本的事件域 F={∅,A,Aˉ,Ω}, 并将 A 称为成功,将 Aˉ 称为失败。这样的只有两个可能结果的试验称为伯努利试验。
对于伯努利试验,为简化公式,我们一般记事件A 发生的概率为 p, 事件 Aˉ 发生的概率为 q=1−p. 离散概率分布大多与伯努利试验相关。
# 伯努利分布
只进行一次伯努利试验,事件 A 发生次数的概率分布称为伯努利分布,又称 0-1 分布。其期望为 p, 方差为 pq. 证明是显然的。
# 二项分布
在n 重伯努利试验中事件A 出现k 次这一事件记作Bk,其概率记作b(k;n,p)。Bk 关于k 的分布称为二项分布 (binary distribution).
显然,b(k;n,p)=(kn)pkqn−k, k=0,1,…,n。
性质 二项分布的期望为np,方差为npq。
证明
注意到
EX=k=0∑nk2n(kn)pkqn−k=nk=1∑n2n(k−1n−1)pkqn−k=np(p+q)n−1=np
于是期望为 np.
又,
EX2=k=0∑nk22n(kn)pkqn−k=nk=1∑nk2n(k−1n−1)pkqn−k=nk=1∑n(k−1)2n(k−1n−1)pkqn−k+nk=1∑n2n(k−1n−1)pkqn−k=n(n−1)p2+np
则
DX=EX2−(EX)2=npq
或者,可以根据 n 个伯努利分布的独立性证明。
在二项分布中,我们称距离期望 E 最近的整数 [np+21] 为事件 A 的最可能次数。
# 几何分布
伯努利试验中首次成功出现在第 k 次试验这一事件记作 Wk, 对应的概率称为 g(k;p). Wk 关于 k 的分布称为几何分布 (geometry distribution)
显然,g(k;p)=pqk−1.
性质 几何分布的期望为 p1, 方差为 pq1.
证明
期望 EX=∑i=1∞ipqi−1, 根据柯西根值判别法知 EX 收敛,于是 EX−qEX=p∑i=1∞qi=1, 于是 EX=1−q1=p1.
采用柯西根值判别法同样可证 EX2 收敛,则 EX2=p∑i=1∞i2qi, 类似错位相减得
# 泊松分布
# 泊松过程
# 连续概率分布
# 指数分布
指数分布的密度函数为
f(x)={λe−λx0x≥0x<0
分布函数为
F(x)={1−e−λx0x≥0x<0
性质 指数分布的期望 EX=λ1, 方差 DX=λ21.
证明
EX=∫0+∞λxe−λxdx=λ1Γ(2)=λ1
DX=EX2−(EX)2=λ21∫0+∞λ2x2e−λxdλx−λ21=λ21Γ(3)−λ21=λ21
# 正态分布
正态分布是连续型分布中最重要的分布。
# 一般的正态分布
我们称密度函数为
f(x)=2πσ1e−2σ2(x−μ)2,x∈R
的概率分布为正态分布。其分布函数
F(x)=2πσ1∫−∞xe−2σ2(x−μ)2dx
没有初等形式。
正态分布包括两个参数 μ 和 σ, 其中 μ 仅决定正态分布函数图像的位置,σ 仅决定正态分布函数图像的形状,因此称 μ 为正态分布的位置参数,称 σ 为正态分布的尺度参数。若随机变量 X 服从于未知参数 μ, 尺度参数 σ 的正态分布,则记作 X∼N(μ,σ).
性质 1 正态分布的期望为 μ, 方差为 σ2.
证明
EX=2πσ1∫−∞+∞xe−2σ2(x−μ)2dx=2πσ1∫−∞+∞(x−μ)e−2σ2(x−μ)2d(x−μ)+2πσ1∫−∞+∞μe−2σ2(x−μ)2dx=0+μ=μ
方差类似。
注意到,由于上面的计算过于繁杂,因此我们引入标准化的正态分布。
# 标准正态分布
我们称 N(0,1) 为标准正态分布。于是其期望为 0, 方差为 1. 通常情况下,标准正态分布记作 U, 其密度函数记作 ϕ(u), 分布函数记作 Φ(u). Φ(u) 的值一般可以通过查表获得。
标准正态分布有一些基本的性质,我们不加证明地列举如下:
- Φ(−u)=1−Φ(u).
- P(U>u)=1−Φ(u).
- P(a<U<b)=Φ(b)−Φ(a).
对于一般的正态分布 X∼N(μ,σ2), 有 X∗:=(X−μ)/σ∼N(0,1). 我们称将 X 变换为 (X−μ)/σ 的过程为正态分布的标准化。显然,通过标准化求一般正态分布的期望和方差是更加便捷的。
# 伽马分布
密度函数为
p(x)=⎩⎪⎪⎨⎪⎪⎧Γ(α)λαxα−1e−λx0x≥0x<0
的分布称为形状参数为 α, 尺度参数为 λ 的伽马分布 (Gamma distribution), 记作 Ga(α,λ).
根据伽马函数的性质,可以得到伽马分布的期望和方差:
EX=∫0∞Γ(α)λαxαe−λxdx=λΓ(α)Γ(α+1)=λα
类似地,
EX2=∫0∞Γ(α)λαxα+1e−λxdx=λ2Γ(α)Γ(α+2)=λ2α(α+1)
因此作差得到
DX=EX2−(EX)2=λ2α
伽马分布的一个特点是其具有可加性,即 Ga(α1,λ)+Ga(α2,λ)=Ga(α1+α2,λ).
# 柯西分布
我们称密度函数为
f(x;x0,γ)=π1(x−x0)2+γ2γ
的概率分布为柯西分布。其中x0 为分布峰值位置的位置参数,γ 为最大值一半处的一般宽度,称为尺度参数。若随机变量X 服从于位置参数为x0,尺度参数为γ 的柯西分布,那么记作X∼C(γ,x0)。其中,C(1,0) 称为标准柯西分布。
容易求得,柯西分布 C(γ,x0) 的分布函数为
F(x;x0,γ)=π1arctanγx−x0+21
由于
∫−∞+∞∣x∣f(x)dx
发散,故其期望不存在。类似地,其高阶矩 (如方差) 亦不存在。