# 随机变量

# 离散型随机变量

# 连续型随机变量

定义

# 多维随机变量

# 概念

将多个一维的随机变量进行组合,就得到了多维随机变量。我们一般以二维随机变量(X,Y)(X,Y) 作为对象进行研究。这样,我们可以类似地定义二维随机变量的联合分布函数p(x,y)=P(Xx,Yy)p(x,y) = P(X≤x,Y≤y)

对二维随机变量,我们依然可以将其分为离散型随机变量连续型随机变量。然而,依旧存在既不为连续型也不为离散型的情况。例如,我们取X=YN(0,1)X=Y\sim N(0,1),则(X,Y)(X,Y) 只分布于y=xy=x 上,从而不能表示成二重积分的形式,因此不为连续型随机变量。

# 边际分布

对二维随机变量(X,Y)(X,Y),我们以XX 为变量,对YY 取一切值的概率求和得到的函数称为(X,Y)(X,Y) 关于XX 的边际概率分布。常用fX(x)f_X(x) 表示。例如,对连续型随机变量,有fX(x)=+p(x,y)dy\displaystyle f_X(x) = \int_{-\infty}^{+\infty}p(x,y)\mathrm dy。关于YY 的编辑概率分布也是类似的。

# 条件分布

对二维随机变量(X,Y)(X,Y),我们将Y=y0Y=y_0 时,X=x0X=x_0 的概率称为Y=y0Y=y_0 条件下,XX条件分布律,记作P(X=xiY=y0)P(X=x_i|Y=y_0)i=1,2,i=1,2,\dots

# 独立性

定义若二维随机变量(X,Y)(X,Y) 满足x,yR\forall x,y \in \mathbb R,事件{Xx}\{X\leq x\} 与事件{Yy}\{Y\leq y\} 相互独立,则称随机变量XXYY 相互独立

因此,想要判断两随机变量是否相互独立,需要计算两随机变量的边际密度,然后验证乘积是否与联合密度相等。

如果希望判断两随机变量不独立,那么只需要选择两个特定的区间AABB,使得P(XA,YB)P(XA)P(YB)P(X\in A,Y \in B) \neq P(X \in A)P(Y \in B)。这一般比求联合分布更简便。

性质 1X,YX,Y 相互独立,则对a<b,c<d\forall a<b,c<d,事件{a<X<b}\{a<X<b\}{c<Y<d}\{c<Y<d\} 相互独立。

实际上,改换成任何两个博雷尔点集都是成立的,不过证明略显困难。

性质 2 对离散型随机变量X,YX,YXXYY 独立的充要条件为对i,j\forall i,j,有p(xi,yj)=p(xi)p(yj)p(x_i,y_j) = p(x_i)p(y_j)

类比到连续型随机变量也是一样的。

性质 3 对连续型随机变量X,YX,YXXYY 独立的充要条件为p(x,y)=p(x)p(y)p(x,y) = p(x)p(y)x,yR\forall x,y\in \mathbb R

# 二维随机变量函数的分布

(X,Y)(X,Y) 是二维随机变量,则Z=g(X,Y)Z=g(X,Y) 是以为随机变量。下面我们考虑ZZ 的分布。

对于离散的情况,容易得到P(Z=zk)=P(g(X,Y)=zk)=g(xi,yj)=zkpij,k=1,2,.ℙ(Z = z_k) = ℙ(g(X,Y) = z_k) = \sum_{g(x_i,y_j) = z_k}p_{ij},\,k=1,2,\dots.

下面我们主要考虑连续的情况。

对连续的情况,由于不了解函数的性质,故先考虑ZZ 的分布函数

FZ(z)=P(Zz)=P(g(x,y)z)=g(x,y)zf(x,y)dxdyF_Z(z) = ℙ(Z \leq z) = ℙ(g(x,y)\leq z) = \iint\limits_{g(x,y)\leq z}f(x,y) \mathrm dx \mathrm dy

在此基础上求导可以得到 ZZ 的密度函数 f(z)=FZ(z)f(z) = F_Z'(z).

下面,我们对几种常见的函数 g(x,y)g(x,y) 进行分析。

# 和的分布

Z=g(X,Y)=X+YZ = g(X,Y) = X+Y, 则有

FZ(z)=P(X+Yz)=x+yzf(x,y)dxdy=+zxf(x,y)dydxF_Z(z) = \mathbb{P}(X+Y \leq z) = \iint\limits_{x+y\leq z}f(x,y)\mathrm dx\mathrm dy = \int_{-\infty}^{+\infty}\int_{-\infty}^{z-x}f(x,y)\mathrm dy\mathrm dx

进行变量代换 y=uxy = u-x 可得

FZ(z)=+zf(x,ux)dudx=z+f(x,ux)dxduF_Z(z) = \int_{-\infty}^{+\infty}\int_{-\infty}^zf(x,u-x)\mathrm du\mathrm dx = \int_{-\infty}^z\int_{-\infty}^{+\infty}f(x,u-x)\mathrm dx\mathrm du

此时,密度函数为

fZ(z)=+f(x,zx)dx=+f(zy,y)dyf_Z(z) = \int_{-\infty}^{+\infty}f(x,z-x)\mathrm dx = \int_{-\infty}^{+\infty}f(z-y,y)\mathrm dy

X,YX,Y 独立,则有

fZ(z)=+fX(x)fY(zx)dx=+fX(zy)fY(y)dyf_Z(z) = \int_{-\infty}^{+\infty}f_X(x)f_Y(z-x)\mathrm dx = \int_{-\infty}^{+\infty}f_X(z-y)f_Y(y)\mathrm dy

我们称此公式为概率密度函数的卷积公式

XN(μ1,σ12)X\sim N(\mu_1,\sigma_1^2)YN(μ2,σ22)Y\sim N(\mu_2,\sigma_2^2),则Z=X+YN(μ1+μ2,σ12+σ22)Z = X+Y \sim N(\mu_1 + \mu_2,\sigma_1^2 + \sigma_2^2)

证明根据卷积公式,
fZ(z)=12πσ1σ2+exp(x22σ12(zx)22σ22)dx=12πσ1σ2+exp((σ12+σ22)x22σ12zx+σ12z22σ12σ22)dx=12πσ1σ2+exp((σ12+σ22)(xσ12σ12+σ22z)2+σ12σ22σ12+σ22z22σ12σ22)dx=12πσ1σ2exp(z22(σ12+σ22))+exp((σ12+σ22)t22σ12σ22)dt=12π(σ12+σ22)exp(z22(σ12+σ22))\begin{aligned} f_Z(z) & = \frac{1}{2\pi\sigma_1\sigma_2}\int_{-\infty}^{+\infty}\exp\left(-\frac{x^2}{2\sigma_1^2}-\frac{(z-x)^2}{2\sigma_2^2}\right) \mathrm dx\\ & = \frac{1}{2\pi\sigma_1\sigma_2}\int_{-\infty}^{+\infty}\exp\left(-\frac{(\sigma_1^2 + \sigma_2^2)x^2 -2\sigma_1^2zx + \sigma_1^2z^2 }{2\sigma_1^2\sigma_2^2}\right) \mathrm dx \\ & = \frac{1}{2\pi\sigma_1\sigma_2}\int_{-\infty}^{+\infty}\exp\left(-\frac{(\sigma_1^2 + \sigma_2^2)(x - \tfrac{\sigma_1^2}{\sigma_1^2 + \sigma_2^2}z)^2 + \tfrac{\sigma_1^2\sigma_2^2}{\sigma_1^2 + \sigma_2^2}z^2 }{2\sigma_1^2\sigma_2^2}\right) \mathrm dx \\ & = \frac{1}{2\pi\sigma_1\sigma_2}\cdot \exp\left(-\frac{z^2}{2(\sigma_1^2 + \sigma_2^2)}\right)\int_{-\infty}^{+\infty}\exp\left(-\frac{(\sigma_1^2 + \sigma_2^2)t^2 }{2\sigma_1^2\sigma_2^2}\right) \mathrm dt\\ & = \frac{1}{\sqrt{2\pi(\sigma_1^2 + \sigma_2^2)}}\exp\left(-\frac{z^2}{2(\sigma_1^2 + \sigma_2^2)}\right) \end{aligned}
这就证明了若XN(0,σ12)X \sim N(0,\sigma_1^2)YN(0,σ22)Y\sim N(0,\sigma_2^2),则Z=X+YN(0,σ12+σ22)Z = X+Y \sim N(0,\sigma_1^2 + \sigma_2^2)。又显然可以进行代换X=Xμ1X' = X-\mu_1Y=Yμ2Y' = Y-\mu_2,则Z=Zμ1μ2N(0,σ12+σ22)Z' = Z - \mu_1 - \mu_2 \sim N(0,\sigma_1^2 + \sigma_2^2),于是Z=X+YN(μ1+μ2,σ12+σ22)Z = X+Y \sim N(\mu_1 + \mu_2,\sigma_1^2 + \sigma_2^2)

# 商的分布