随机变量及其分布
一、随机变量及其分布函数
随机变量:设 $E$ 是随机试验,它的样本空间为 $\Omega={e}$ ,如果对于每一个 $e \in \Omega$ ,都有唯一的实数 $X(e)$ 和它对应,且对于任何实数 $x$,${X(e) \leq x}$ 具有确定的概率,则称 $X(e)$(简记为 $X$ )为随机变量(Random Variable),简记为$r\cdot v$。
简单来说,随机变量是随机事件的映射,用来简化随机事件的表示。
分布函数:设 $X$ 为一随机变量,$\forall x \in R$ ,令$F(x)=P{X \in(-\infty, x]}=P{X \leq x}$,则称 $F(x)$ 为 $r \cdot v X$ 的分布函数。
分布函数具有如下性质
- $0 \leq F(x) \leq 1$;
- $F(x)$是一个单调不减函数;
- $F(x)$右连续,即 $\lim_{x \rightarrow a^{+}} F(x)=F(a)$;
- $\lim{x \rightarrow+\infty} F(x)=1$,$\lim{x \rightarrow-\infty} F(x)=0$。
注意:$F(x)=P{X\leq x}$,$F(x^-)=P{X<x}$。
二、离散型随机变量及概率分布
1、离散型随机变量的分布
离散型随机变量:若随机变量的所有可能取值为有限个或可列个,我们称这类随机变量为离散型随机变量。
离散型随机变量的概率分布:设 X 为离散型 $r \cdot v$ ,所有可能取值为 $x{k}(k=1,2, \cdots)$ ,且$P{X=x{k}} = p{k} (k=1,2, \cdots)$。则称 $p{k}(k=1,2, \cdots)$ 为 X 的概率分布(分布律)简记为 ${p{k}}{1}^{\infty}$ 。
离散型随机变量概率分布 ${p{k}}{1}^{\infty}$ 的性质:
- $p_{k} \geq 0(k=1,2, \cdots)$;
- $\sum{k=1}^{\infty} p{k}=1$。
2、常用的离散型随机变量分布
0-1分布:若 X 的分布列为
| $X$ | 0 | 1 |
|---|---|---|
| $P$ | $1-p$ | $p$ |
即$P{X=k}=p^{k}(1-p)^{1-k}(k=0,1)$
则称 $X$ 服从参数为 $p$ 的0-1分布,记为 $X \sim B(1, p)$。对只含两个样本点的样本空间 $\Omega={e{1}, e{2}}$ 总可定义
二项分布:若随机试验 $E$ 只有两个可能的结果 $A$ 与 $\bar{A}$ ,记 $P(A)=p$,$P(\bar{A})=1-p=q(0<p<1)$ ,将试验 $E$ 独立地重复进行 $n$ 次,则称这一串独立重复试验为n重伯努利试验。以 $X$ 表示 $n$ 重贝努利试验中事件 $A$ 发生的次数,则 $X$ 是一随机变量,$X$ 的可能取值为 $0,1,2, \cdots, n$ 。 $A$ 出现 $k$ 次的概率为 $P{X=k}= P{n}(k)$。$P{X=k}=C{n}^{k} p^{k} q^{n-k}(k=0,1,2, \cdots, n)$。则称 $X$ 为服从参数$n$,$p$的二项分布,记作$X \sim B(n, p)$。
泊松分布:如果随机变量 $X$ 的所有可能取值为 $0,1,2, \cdots$ ,其分布律为,则称 $X$ 服从参数为 $\lambda$ 的泊松分布,记为 $X \sim P(\lambda)$ 。
泊松分布是概率论中一个重要的离散分布,主要用于描述单位时间或单位空间内随机事件的发生次数。是指数分布的离散版本。此外,泊松分布是二项分布的极限形式,当试验次数$n$很大,成功概率$p$很小,且$\lambda=np$为有限值时,二项分布可以用泊松分布近似表示,$C_{n}^{k} p^{k}(1-p)^{n-k} \approx \frac{\lambda^{k} e^{-\lambda}}{k!}$。
三、连续型随机变量及概率分布
1、连续型随机变量的分布
连续型随机变量:若 $r\cdot v X$ 的分布函数 $F(x)$ 可表示成$F(x)=\int_{-\infty}^{x} f(u) d u$,其中 $f(x)$ 为一非负可积函数,则称 $X$ 为连续型随机变量, $f(x)$ 称为 $X$ 的概率密度函数(或概率分布、分布密度)。
连续型 $r\cdot v X$ 的分布函数 $F(x)$ 是连续函数,而概率密度不一定连续。
概率密度 f(x) 具有如下性质:
- $f(x) \geq 0$ ;
- $\int_{-\infty}^{+\infty} f(x) d x=1$;
- $P{x{1}<X \leq x{2}}=F(x{2})-F(x{1})=\int{x{1}}^{x_{2}} f(x) d x$;
- 若 $f(x)$ 在 $x$ 点连续,则 $F^{\prime}(x)=f(x)$。
注意:与离散型随机变量的分布函数不同,在连续型随机变量的分布中,$\forall a\in R,P{X=a}=F(a)-F(a-0)=0$;
2、常用的连续型随机变量分布
均匀分布:
设随机变量 $X$ 在有限区间 $[a, b]$ 内取值,且其分布密度为 ,则称 $X$ 在有限区间 $[a, b]$ 上服从均匀分布,记为 $X \sim U(a, b)$ 。其分布函数为
指数分布:
若随机变量 $X$ 的概率密度
其中 $\lambda>0$ 为常数,则称 $X$ 服从参数为 $\lambda$ 的指数分布,记为 $X \sim e(\lambda)$。分布函数为
指数分布是概率论中一种重要的分布,用来描述事件发生的时间间隔。
正态分布:若随机变量 $X$ 的分布密度为
其中 $\mu$,$\sigma(\sigma>0)$ 为常数,则称 $X$ 服从参数为 $\mu$,$\sigma$ 的正态分布或高斯分布,记为 $X \sim N(\mu, \sigma^{2})$ 。分布函数为
特别地,当 $\mu=0$,$\sigma=1$ 时,图形关于 $x=0$ 对称,此时称 X 服从标准正态分布,记为 $X \sim N(0,1)$ 。密度函数变为
其分布函数为 正态分布的性质如下:
- $\frac {X-\mu}{\sigma} \sim N(0,1)$ ,这反映了一般正态分布与标准正态分布的关系,由此可得,$F(x)=\Phi(\frac{x-\mu}{\sigma})$。
- $\varphi(-x)=\varphi(x)$,$\Phi(-x)=1-\Phi(x)$。
四、随机向量及其分布
1、二维随机变量及其联合分布
随机向量:一般地,设 $X{1}, X{2}, \cdots, X{n}$ 为定义同一个样本空间上的$r \cdot v$,称$X=(X{1}, X{2}, \cdots, X{n})$为 $n$ 维随机向量或 $n$ 维 $r \cdot v$ 。
设 $(X, Y)$ 为二维 $r \cdot v$,$\forall x, y \in R$ ,称$F(x, y)=P{X \leq x, Y \leq y}$为随机向量 $(X, Y)$ 的分布函数,或随机变量 $X$ 和 $Y$ 的联合分布函数。
$F(x, y)$ 有如下性质:
- $0 \leq F(x, y) \leq 1$;且
对任意固定的 $y$,$F(-\infty, y)=0$;
对任意固定的 $x$,$F(x,-\infty)=0$;
及 $F(-\infty,-\infty)=0$ ; $F(+\infty,+\infty)=1$ ; - $F(x, y)$ 是变量 $x$ 和 $y$ 的不减函数;
- $F(x, y)$ 关于变量 $x$ 和变量 $y$ 右连续;
- $\forall x{1}<x{2}, y{1}<y{2}$ 有$F(x{2}, y{2})-F(x{2}, y{1})-F(x{1}, y{2})+F(x{1}, y{1}) \geq 0$。
二维离散型随机变量:如果 $(X, Y)$ 的所有可能取值是有限个或可列无穷个,记为 $(x{i}, y{j})(i, j=1,2,3, \cdots)$ ,则称 $(X, Y)$ 为二维离散型 $r \cdot v$ 。并称$P{X=x{i}, Y=y{j}} = p_{i j} (i, j=1,2,3, \cdots)$为二维离散型 $r \cdot v(X, Y)$ 的分布律或 $X$ 与 $Y$ 的联合分布律。 $X$ 与 $Y$ 的联合分布律也可用概率分布表表示。
二维连续型随机变量:对于二维随机变量 $(X, Y)$,$F(x, y)$ 为 $(X, Y)$ 的分布函数。若存在非负可积函数 $f(x, y)$ ,使对任意实数 $x$ 、$y$ 有$F(x, y)=\int{-\infty}^{x} \int{-\infty}^{y} f(u, v) d u d v$,则称 $(X, Y)$ 为二维连续型随机变量,$f(x, y)$ 称为 $(X, Y)$ 的概率密度或 $X$ 、$Y$ 的联合概率密度。
概率密度 $f(x, y)$ 有如下性质:
- $f(x, y) \geq 0$;
- $\int{-\infty}^{+\infty} \int{-\infty}^{+\infty} f(x, y) d x d y=1$;
- 若 $f(x, y)$ 在点 $(x, y)$ 处连续,则$f(x, y)=\frac{\partial^{2} F(x, y)}{\partial x \partial y}$;
- 设 $G$ 为一平面区域,则$P{(X, Y) \in G}=\iint{G} f(x, y) d x d y$。特别地,$P{x{1}<X \leq x{2}, y{1}<Y \leq y{2}}=\int{x{1}}^{x{2}} \int{y{1}}^{y_{2}} f(x, y) d x d y$。
2、二维随机变量的边缘分布
边缘分布函数:设 $(X, Y)$ 的分布函数 $F(x, y)$ ,则关于 $X$ 和关于 $Y$ 的边缘分布函数分别为
设 $(X, Y)$ 为离散型 $r\cdot v$,其分布律为$P{X=x{i}, Y=y{j}} = p_{i j} (i, j=1,2,3, \cdots)$,则关于 X 和关于 Y 的边缘分布律分别为
设 $(X, Y)$ 为连续型 $r\cdot v$,概率密度为 $f(x, y)$ ,则关于 $X$ 和关于 $Y$ 的边缘分布密度分别为
3、二维随机变量的条件分布
二维离散型随机变量的条件分布律:
设 $(X, Y)$ 为离散型随机变量,对于固定的 $j$ ,若$P{Y=yj}>0$,则称$$P{X=x{i} \mid Y=y{j}}=\frac{P{X=x{i}, Y=y{j}}}{P{Y=y{j}}}=\frac{p{i j}}{p{\cdot j}}(i=1,2,3, \cdots)$$为在 $Y=y_{j}$ 的条件下随机变量 $X$ 的条件分布律。
同样地,可定义 $Y$ 的条件分布律,称
为在 $X=x_{i}$ 的条件下随机变量 $Y$ 的条件分布律。
即
二维连续性随机变量的条件概率密度:
设$(X,Y)$为连续型随机变量,其概率密度为$f(x,y)$,边缘概率密度分别为$fX(x)$和$f_Y(y)$。若$f_Y(y)\ne 0$,则称$f{X \mid Y}(x \mid y)=\frac{f(x, y)}{f{Y}(y)}$为在$Y=y$条件下$X$的条件概率密度。则$F{X \mid Y}(x \mid y)=\int{-\infty}^{x} f{X \mid Y}(x \mid y) d x$。
同理,若$fX(x)\ne 0$,则称$f{Y \mid Y}(y \mid x)=\frac{f(x, y)}{f{X}(x)}$为在$X=x$条件下$Y$的条件概率密度。则$F{Y \mid X}(y \mid x) =\int{-\infty}^{y} f{Y \mid X}(y \mid x) d y$。
4、常用的二维连续型随机变量分布
二维均匀分布:
设 $G$ 为一平面区域,$G$ 的面积为 $A(0<A<+\infty)$ ,若 $(X, Y)$ 的概率密度为
则称 $(X, Y)$ 在 $G$ 上服从均匀分布,记为$(X, Y) \sim U(G)$。
二维正态分布:
如果 (X, Y) 的概率密度为$f(x, y)=\frac{1}{2 \pi \sigma{1} \sigma{2} \sqrt{1-\rho^{2}}} \exp {\bullet} (-\infty
二维正态分布的性质:
设$(X, Y) \sim N(\mu{1}, \mu{2} ; \sigma{1}^{2}, \sigma{2}^{2} ; \rho)$,则
- 两个边缘分布均为正态分布,$X\sim N(\mu_1,\sigma_1^2)$,$Y\sim N(\mu_2,\sigma_2^2)$;
- $X$与$Y$相互独立的充分必要条件为$\rho =0$;
- $X$与$Y$的非零线性组合$(aX+bY,cX+dY)$服从二维正态分布。
五、随机变量的独立性
二维随机变量的独立性:
设 $F(x, y)$ 、 $F{X}(x)$ 和 $F{Y}(y)$ ,依次为 $(X, Y)$ 的分布函数、边缘分布函数。若对任意的实数 $x, y$ 有$F(x, y)=F{X}(x) \cdot F{Y}(y)$,即 $P{X \leq x, Y \leq y}=P{X \leq x} \cdot P{Y \leq y}$,则称随机变量 $X$ 与 $Y$ 相互独立。
当 $(X, Y)$ 为离散型 $r\cdot v$ 时,上面的条件等价于$P{X=x{i}, Y=y{j}}=P{X=x{i}} \cdot P{Y=y{j}}$,简记 $p{i j}=p{i \cdot} \cdot p_{\cdot j}(i, j=1,2,3, \cdots)$。
六、随机变量函数的分布
1、离散型随机变量函数的分布
离散型随机变量的函数的分布一般都是求分布律,只要根据表格逐项计算即可。
2、连续型随机变量函数的分布
设 $X$ 为连续型随机变量,其分布密度为 $f(x)$,$y=g(x)$ 是一处处可导而且严格单调函数,则 $Y=g(X)$ 是连续型随机变量,其分布密度为

