随机变量及其分布

一、随机变量及其分布函数

随机变量:设 EE 是随机试验,它的样本空间为 Ω={e}\Omega=\{e\} ,如果对于每一个 eΩe \in \Omega ,都有唯一的实数 X(e)X(e) 和它对应,且对于任何实数 xx{X(e)x}\{X(e) \leq x\} 具有确定的概率,则称 X(e)X(e)(简记为 XX )为随机变量(Random Variable),简记为rvr\cdot v

简单来说,随机变量是随机事件的映射,用来简化随机事件的表示。

分布函数:设 XX 为一随机变量,xR\forall x \in R ,令F(x)=P{X(,x]}=P{Xx}F(x)=P\{X \in(-\infty, x]\}=P\{X \leq x\},则称 F(x)F(x)rvXr \cdot v X 的分布函数。

分布函数具有如下性质

  1. 0F(x)10 \leq F(x) \leq 1
  2. F(x)F(x)是一个单调不减函数;
  3. F(x)F(x)右连续,即 limxa+F(x)=F(a)\lim_{x \rightarrow a^{+}} F(x)=F(a)
  4. limx+F(x)=1\lim_{x \rightarrow+\infty} F(x)=1limxF(x)=0\lim_{x \rightarrow-\infty} F(x)=0

注意:F(x)=P{Xx}F(x)=P\{X\leq x\}F(x)=P{X<x}F(x^-)=P\{X<x\}

二、离散型随机变量及概率分布

1、离散型随机变量的分布

离散型随机变量:若随机变量的所有可能取值为有限个或可列个,我们称这类随机变量为离散型随机变量。

离散型随机变量的概率分布:设 X 为离散型 rvr \cdot v ,所有可能取值为 xk(k=1,2,)x_{k}(k=1,2, \cdots) ,且P{X=xk}=pk(k=1,2,)P\{X=x_{k}\} = p_{k} (k=1,2, \cdots)。则称 pk(k=1,2,)p_{k}(k=1,2, \cdots) 为 X 的概率分布(分布律)简记为 {pk}1\{p_{k}\}_{1}^{\infty}

离散型随机变量概率分布 {pk}1\{p_{k}\}_{1}^{\infty} 的性质:

  • pk0(k=1,2,)p_{k} \geq 0(k=1,2, \cdots)
  • k=1pk=1\sum_{k=1}^{\infty} p_{k}=1
2、常用的离散型随机变量分布

0-1分布:若 X 的分布列为

XX 0 1
PP 1p1-p pp

P{X=k}=pk(1p)1k(k=0,1)P\{X=k\}=p^{k}(1-p)^{1-k}(k=0,1)
则称 XX 服从参数为 pp 的0-1分布,记为 XB(1,p)X \sim B(1, p)。对只含两个样本点的样本空间 Ω={e1,e2}\Omega=\{e_{1}, e_{2}\} 总可定义

X=X(e)={1,e=e10,e=e2.X=X(e)=\{\begin{array}{ll} 1, & e=e_{1} \\ 0, & e=e_{2} \end{array}.

二项分布:若随机试验 EE 只有两个可能的结果 AAAˉ\bar{A} ,记 P(A)=pP(A)=pP(Aˉ)=1p=q(0<p<1)P(\bar{A})=1-p=q(0<p<1) ,将试验 EE 独立地重复进行 nn 次,则称这一串独立重复试验为n重伯努利试验。以 XX 表示 nn 重贝努利试验中事件 AA 发生的次数,则 XX 是一随机变量,XX 的可能取值为 0,1,2,,n0,1,2, \cdots, nAA 出现 kk 次的概率为 P{X=k}=Pn(k)P\{X=k\}= P_{n}(k)P{X=k}=Cnkpkqnk(k=0,1,2,,n)P\{X=k\}=C_{n}^{k} p^{k} q^{n-k}(k=0,1,2, \cdots, n)。则称 XX 为服从参数nnpp的二项分布,记作XB(n,p)X \sim B(n, p)

泊松分布:如果随机变量 XX 的所有可能取值为 0,1,2,0,1,2, \cdots ,其分布律为$$P{X=k}=\frac{\lambda^{k} e^{-\lambda}}{k!} (k=0,1,2, \cdots ; \lambda>0)$$,则称 XX 服从参数为 λ\lambda 的泊松分布,记为 XP(λ)X \sim P(\lambda)

泊松分布是概率论中一个重要的离散分布,主要用于描述单位时间或单位空间内随机事件的发生次数。是指数分布的离散版本。此外,泊松分布是二项分布的极限形式,当试验次数nn很大,成功概率pp很小,且λ=np\lambda=np为有限值时,二项分布可以用泊松分布近似表示,Cnkpk(1p)nkλkeλk!C_{n}^{k} p^{k}(1-p)^{n-k} \approx \frac{\lambda^{k} e^{-\lambda}}{k!}

三、连续型随机变量及概率分布

1、连续型随机变量的分布

连续型随机变量:若 rvXr\cdot v X 的分布函数 F(x)F(x) 可表示成F(x)=xf(u)duF(x)=\int_{-\infty}^{x} f(u) d u,其中 f(x)f(x) 为一非负可积函数,则称 XX 为连续型随机变量, f(x)f(x) 称为 XX概率密度函数(或概率分布分布密度)。

连续型 rvXr\cdot v X 的分布函数 F(x)F(x) 是连续函数,而概率密度不一定连续。

概率密度 f(x) 具有如下性质:

  1. f(x)0f(x) \geq 0
  2. +f(x)dx=1\int_{-\infty}^{+\infty} f(x) d x=1
  3. P{x1<Xx2}=F(x2)F(x1)=x1x2f(x)dxP\{x_{1}<X \leq x_{2}\}=F(x_{2})-F(x_{1})=\int_{x_{1}}^{x_{2}} f(x) d x
  4. f(x)f(x)xx 点连续,则 F(x)=f(x)F^{\prime}(x)=f(x)

注意:与离散型随机变量的分布函数不同,在连续型随机变量的分布中,aR,P{X=a}=F(a)F(a0)=0\forall a\in R,P\{X=a\}=F(a)-F(a-0)=0

2、常用的连续型随机变量分布

均匀分布
设随机变量 XX 在有限区间 [a,b][a, b] 内取值,且其分布密度为 $$f(x)={\begin{array}{cc}\frac{1}{b-a}, & a \leq x \leq b \ 0, & \text { 其他 }\end{array}.$$ ,则称 XX 在有限区间 [a,b][a, b] 上服从均匀分布,记为 XU(a,b)X \sim U(a, b) 。其分布函数为

F(x)={0,x<axaba,ax<b1,xb.F(x)=\{\begin{array}{cc} 0, & x<a \\ \frac{x-a}{b-a}, & a \leq x<b \\ 1, & x \geq b \end{array}.

指数分布
若随机变量 XX 的概率密度

f(x)={λeλx,x>00,x0.f(x)=\{\begin{array}{ll} \lambda e^{-\lambda x}, & x>0 \\ 0, & x \leq 0 \end{array}.

其中 λ>0\lambda>0 为常数,则称 XX 服从参数为 λ\lambda 的指数分布,记为 Xe(λ)X \sim e(\lambda)。分布函数为

F(x)={0,x<01eλx,x0.F(x)=\{\begin{array}{l} 0, x<0 \\ 1-e^{-\lambda x}, x \geq 0 \end{array}.

指数分布是概率论中一种重要的分布,用来描述事件发生的时间间隔。

正态分布:若随机变量 XX 的分布密度为$$f(x)=\frac{1}{\sqrt{2 \pi} \sigma} e^{-\frac{1}{2 \sigma{2}}(x-\mu){2}} (-\infty<x<+\infty)$$
其中 μ\muσ(σ>0)\sigma(\sigma>0) 为常数,则称 XX 服从参数为 μ\muσ\sigma 的正态分布或高斯分布,记为 XN(μ,σ2)X \sim N(\mu, \sigma^{2}) 。分布函数为

F(x)=x12πσe12σ2(tμ)2dtF(x)=\int_{-\infty}^{x} \frac{1}{\sqrt{2 \pi} \sigma} e^{-\frac{1}{2 \sigma^{2}}(t-\mu)^{2}} d t

特别地,当 μ=0\mu=0σ=1\sigma=1 时,图形关于 x=0x=0 对称,此时称 X 服从标准正态分布,记为 XN(0,1)X \sim N(0,1) 。密度函数变为

φ(x)=12πe12x2(<x<+)\varphi(x)=\frac{1}{\sqrt{2 \pi}} e^{-\frac{1}{2} x^{2}} (-\infty<x<+\infty)

其分布函数为 $$\Phi(x)=\int_{-\infty}^{x} \frac{1}{\sqrt{2 \pi}} e^{-\frac{1}{2} t^{2}} d t (-\infty<x<+\infty)$$ 正态分布的性质如下:

  1. XμσN(0,1)\frac {X-\mu}{\sigma} \sim N(0,1) ,这反映了一般正态分布与标准正态分布的关系,由此可得,F(x)=Φ(xμσ)F(x)=\Phi(\frac{x-\mu}{\sigma})
  2. φ(x)=φ(x)\varphi(-x)=\varphi(x)Φ(x)=1Φ(x)\Phi(-x)=1-\Phi(x)

四、随机向量及其分布

1、二维随机变量及其联合分布

随机向量:一般地,设 X1,X2,,XnX_{1}, X_{2}, \cdots, X_{n} 为定义同一个样本空间上的rvr \cdot v,称X=(X1,X2,,Xn)X=(X_{1}, X_{2}, \cdots, X_{n})nn 维随机向量或 nnrvr \cdot v

(X,Y)(X, Y) 为二维 rvr \cdot vx,yR\forall x, y \in R ,称F(x,y)=P{Xx,Yy}F(x, y)=P\{X \leq x, Y \leq y\}为随机向量 (X,Y)(X, Y) 的分布函数,或随机变量 XXYY 的联合分布函数。

F(x,y)F(x, y) 有如下性质:

  1. 0F(x,y)10 \leq F(x, y) \leq 1;且
    对任意固定的 yyF(,y)=0F(-\infty, y)=0
    对任意固定的 xxF(x,)=0F(x,-\infty)=0
    F(,)=0F(-\infty,-\infty)=0 ; F(+,+)=1F(+\infty,+\infty)=1
  2. F(x,y)F(x, y) 是变量 xxyy 的不减函数;
  3. F(x,y)F(x, y) 关于变量 xx 和变量 yy 右连续;
  4. x1<x2,y1<y2\forall x_{1}<x_{2}, y_{1}<y_{2}F(x2,y2)F(x2,y1)F(x1,y2)+F(x1,y1)0F(x_{2}, y_{2})-F(x_{2}, y_{1})-F(x_{1}, y_{2})+F(x_{1}, y_{1}) \geq 0

二维离散型随机变量:如果 (X,Y)(X, Y) 的所有可能取值是有限个或可列无穷个,记为 (xi,yj)(i,j=1,2,3,)(x_{i}, y_{j})(i, j=1,2,3, \cdots) ,则称 (X,Y)(X, Y) 为二维离散型 rvr \cdot v 。并称P{X=xi,Y=yj}=pij(i,j=1,2,3,)P\{X=x_{i}, Y=y_{j}\} = p_{i j} (i, j=1,2,3, \cdots)为二维离散型 rv(X,Y)r \cdot v(X, Y) 的分布律或 XXYY 的联合分布律。 XXYY 的联合分布律也可用概率分布表表示。

二维连续型随机变量:对于二维随机变量 (X,Y)(X, Y)F(x,y)F(x, y)(X,Y)(X, Y) 的分布函数。若存在非负可积函数 f(x,y)f(x, y) ,使对任意实数 xxyyF(x,y)=xyf(u,v)dudvF(x, y)=\int_{-\infty}^{x} \int_{-\infty}^{y} f(u, v) d u d v,则称 (X,Y)(X, Y) 为二维连续型随机变量,f(x,y)f(x, y) 称为 (X,Y)(X, Y) 的概率密度或 XXYY 的联合概率密度。

概率密度 f(x,y)f(x, y) 有如下性质:

  1. f(x,y)0f(x, y) \geq 0
  2. ++f(x,y)dxdy=1\int_{-\infty}^{+\infty} \int_{-\infty}^{+\infty} f(x, y) d x d y=1
  3. f(x,y)f(x, y) 在点 (x,y)(x, y) 处连续,则f(x,y)=2F(x,y)xyf(x, y)=\frac{\partial^{2} F(x, y)}{\partial x \partial y}
  4. GG 为一平面区域,则P{(X,Y)G}=Gf(x,y)dxdyP\{(X, Y) \in G\}=\iint_{G} f(x, y) d x d y。特别地,P{x1<Xx2,y1<Yy2}=x1x2y1y2f(x,y)dxdyP\{x_{1}<X \leq x_{2}, y_{1}<Y \leq y_{2}\}=\int_{x_{1}}^{x_{2}} \int_{y_{1}}^{y_{2}} f(x, y) d x d y
2、二维随机变量的边缘分布

边缘分布函数:设 (X,Y)(X, Y) 的分布函数 F(x,y)F(x, y) ,则关于 XX 和关于 YY 的边缘分布函数分别为

FX(x)=F(x,+)=limy+F(x,y)FY(y)=F(+,y)=limx+F(x,y)\begin{array}{l} F_{X}(x)=F(x,+\infty)=\lim _{y \rightarrow+\infty} F(x, y) \\ F_{Y}(y)=F(+\infty, y)=\lim _{x \rightarrow+\infty} F(x, y) \end{array}

(X,Y)(X, Y) 为离散型 rvr\cdot v,其分布律为P{X=xi,Y=yj}=pij(i,j=1,2,3,)P\{X=x_{i}, Y=y_{j}\} = p_{i j} (i, j=1,2,3, \cdots),则关于 X 和关于 Y 的边缘分布律分别为

P{X=xi}=j=1pij=pi.(i=1,2,3,)P{Y=yj}=i=1pij=pj(j=1,2,3,)\begin{array}{l} P\{X=x_{i}\}=\sum_{j=1}^{\infty} p_{i j} = p_{i .} (i=1,2,3, \cdots) \\ P\{Y=y_{j}\}=\sum_{i=1}^{\infty} p_{i j} = p_{\cdot j} (j=1,2,3, \cdots) \end{array}

(X,Y)(X, Y) 为连续型 rvr\cdot v,概率密度为 f(x,y)f(x, y) ,则关于 XX 和关于 YY 的边缘分布密度分别为

fX(x)=+f(x,y)dyfY(y)=+f(x,y)dx\begin{aligned} f_{X}(x) & =\int_{-\infty}^{+\infty} f(x, y) d y \\ f_{Y}(y) & =\int_{-\infty}^{+\infty} f(x, y) d x \end{aligned}

3、二维随机变量的条件分布

二维离散型随机变量的条件分布律:
(X,Y)(X, Y) 为离散型随机变量,对于固定的 jj ,若P{Y=yj}>0P\{Y=y_j\}>0,则称$$P{X=x_{i} \mid Y=y_{j}}=\frac{P{X=x_{i}, Y=y_{j}}}{P{Y=y_{j}}}=\frac{p_{i j}}{p_{\cdot j}}(i=1,2,3, \cdots)$$为在 Y=yjY=y_{j} 的条件下随机变量 XX 的条件分布律。
同样地,可定义 YY 的条件分布律,称

P{Y=yjX=xi}=P{X=xi,Y=yj}P{X=xi}=pijpi.(j=1,2,3,)P\{Y=y_{j} \mid X=x_{i}\}=\frac{P\{X=x_{i}, Y=y_{j}\}}{P\{X=x_{i}\}}=\frac{p_{i j}}{p_{i} .}(j=1,2,3, \cdots)

为在 X=xiX=x_{i} 的条件下随机变量 YY 的条件分布律。

即$$条件分布律=\frac{联合分布律}{边缘分布律}$$

二维连续性随机变量的条件概率密度:
(X,Y)(X,Y)为连续型随机变量,其概率密度为f(x,y)f(x,y),边缘概率密度分别为fX(x)f_X(x)fY(y)f_Y(y)。若fY(y)0f_Y(y)\ne 0,则称fXY(xy)=f(x,y)fY(y)f_{X \mid Y}(x \mid y)=\frac{f(x, y)}{f_{Y}(y)}为在Y=yY=y条件下XX的条件概率密度。则FXY(xy)=xfXY(xy)dxF_{X \mid Y}(x \mid y)=\int_{-\infty}^{x} f_{X \mid Y}(x \mid y) d x
同理,若fX(x)0f_X(x)\ne 0,则称fYY(yx)=f(x,y)fX(x)f_{Y \mid Y}(y \mid x)=\frac{f(x, y)}{f_{X}(x)}为在X=xX=x条件下YY的条件概率密度。则FYX(yx)=yfYX(yx)dyF_{Y \mid X}(y \mid x) =\int_{-\infty}^{y} f_{Y \mid X}(y \mid x) d y

4、常用的二维连续型随机变量分布

二维均匀分布
GG 为一平面区域,GG 的面积为 A(0<A<+)A(0<A<+\infty) ,若 (X,Y)(X, Y) 的概率密度为

f(x,y)={1/A,(x,y)G0, 其他 .f(x, y)=\{\begin{array}{cc} 1 / A, & (x, y) \in G \\ 0, & \text { 其他 } \end{array}.

则称 (X,Y)(X, Y)GG 上服从均匀分布,记为(X,Y)U(G)(X, Y) \sim U(G)

二维正态分布
如果 (X, Y) 的概率密度为f(x,y)=12πσ1σ21ρ2exp{}(<x,y<+)f(x, y)=\frac{1}{2 \pi \sigma_{1} \sigma_{2} \sqrt{1-\rho^{2}}} \exp \{\bullet\} (-\infty<x, y<+\infty),其中exp{}=exp{12(1ρ2)[(xμ1σ1)22ρ(xμ1)(yμ2)σ1σ2+(yμ2σ2)2]}\exp \{\bullet\}=\exp \left\{\frac{-1}{2\left(1-\rho^{2}\right)}\left[\left(\frac{x-\mu_{1}}{\sigma_{1}}\right)^{2}-2 \rho \frac{\left(x-\mu_{1}\right)\left(y-\mu_{2}\right)}{\sigma_{1} \sigma_{2}}+\left(\frac{y-\mu_{2}}{\sigma_{2}}\right)^{2}\right]\right\}。则称 (X,Y)(X, Y) 服从参数为 μ1\mu_{1}μ2\mu_{2}σ1(σ1>0)\sigma_{1}(\sigma_{1}>0)σ2(σ2>0)\sigma_{2}(\sigma_{2}>0)ρ(ρ<1)\rho(|\rho|<1) 的二维正态分布。(X,Y)N(μ1,μ2;σ12,σ22;ρ)(X, Y) \sim N(\mu_{1}, \mu_{2} ; \sigma_{1}^{2}, \sigma_{2}^{2} ; \rho)

二维正态分布的性质:
(X,Y)N(μ1,μ2;σ12,σ22;ρ)(X, Y) \sim N(\mu_{1}, \mu_{2} ; \sigma_{1}^{2}, \sigma_{2}^{2} ; \rho),则

  • 两个边缘分布均为正态分布,XN(μ1,σ12)X\sim N(\mu_1,\sigma_1^2)YN(μ2,σ22)Y\sim N(\mu_2,\sigma_2^2)
  • XXYY相互独立的充分必要条件为ρ=0\rho =0
  • XXYY的非零线性组合(aX+bY,cX+dY)(aX+bY,cX+dY)服从二维正态分布。

五、随机变量的独立性

二维随机变量的独立性:
F(x,y)F(x, y)FX(x)F_{X}(x)FY(y)F_{Y}(y) ,依次为 (X,Y)(X, Y) 的分布函数、边缘分布函数。若对任意的实数 x,yx, yF(x,y)=FX(x)FY(y)F(x, y)=F_{X}(x) \cdot F_{Y}(y),即 P{Xx,Yy}=P{Xx}P{Yy}P\{X \leq x, Y \leq y\}=P\{X \leq x\} \cdot P\{Y \leq y\},则称随机变量 XXYY 相互独立。

(X,Y)(X, Y) 为离散型 rvr\cdot v 时,上面的条件等价于P{X=xi,Y=yj}=P{X=xi}P{Y=yj}P\{X=x_{i}, Y=y_{j}\}=P\{X=x_{i}\} \cdot P\{Y=y_{j}\},简记 pij=pipj(i,j=1,2,3,)p_{i j}=p_{i \cdot} \cdot p_{\cdot j}(i, j=1,2,3, \cdots)

六、随机变量函数的分布

1、离散型随机变量函数的分布

离散型随机变量的函数的分布一般都是求分布律,只要根据表格逐项计算即可。

2、连续型随机变量函数的分布

XX 为连续型随机变量,其分布密度为 f(x)f(x)y=g(x)y=g(x) 是一处处可导而且严格单调函数,则 Y=g(X)Y=g(X) 是连续型随机变量,其分布密度为

f_{Y}(y)=\{\begin{array}{cc} f[h(y)]|h^{\prime}(y)|, & \alpha<y<\beta \\ 0, & \text { 其他 } \end{array}.$$其中 $h(y)$ 是 $g(x)$ 的反函数,$\alpha=\min \{g(-\infty), g(+\infty)\}$,$\beta=\max \{g(-\infty), g(+\infty)\}$ 。 ##### 3、二维随机变量函数的分布 $(X, Y)$ 为二维 $r\cdot v$,$z=g(x, y)$ 为连续函数,则称 $Z=g(X, Y)$ 为 $(X, Y)$ 的函数。$Z$ 的分布函数为$F_{Z}(z)=P\{Z \leq z\}=P\{g(X, Y) \leq z\}$,此时有两种求解方法: - 定义法:$F_{Z}(z)=P\{Z \leq z\}=\iint_{g(x, y) \leq z} f(x, y) d x d y$,由此得 Z 的分布密度为$f_{Z}(z)=\frac{d F_{Z}(z)}{d z}=\frac{d}{d z} \iint_{g(x, y) \leq z} f(x, y) d x d y$。 - 卷积公式法:若Z=g(X,Y)是X,Y的线性函数,可反解出Y=h(X,Z)(或X=s(Y,Z)),则Z的概率密度为$$f_{Z}(z)=\int_{-\infty}^{+\infty} f(x, h(x,z))|\frac{\partial[h(x,z)]}{\partial z}| dx$$或$$f_{Z}(z)=\int_{-\infty}^{+\infty} f(s(y,z), y)|\frac{\partial[s(y,z)]}{\partial z}| dy

Author

秦宇春

Posted on

2025-11-08

Updated on

2025-11-08

Licensed under