一、随机变量及其分布函数
随机变量:设 E E E 是随机试验,它的样本空间为 Ω = { e } \Omega=\{e\} Ω = { e } ,如果对于每一个 e ∈ Ω e \in \Omega e ∈ Ω ,都有唯一的实数 X ( e ) X(e) X ( e ) 和它对应,且对于任何实数 x x x ,{ X ( e ) ≤ x } \{X(e) \leq x\} { X ( e ) ≤ x } 具有确定的概率,则称 X ( e ) X(e) X ( e ) (简记为 X X X )为随机变量(Random Variable),简记为r ⋅ v r\cdot v r ⋅ v 。
简单来说,随机变量是随机事件的映射,用来简化随机事件的表示。
分布函数:设 X X X 为一随机变量,∀ x ∈ R \forall x \in R ∀ x ∈ R ,令F ( x ) = P { X ∈ ( − ∞ , x ] } = P { X ≤ x } F(x)=P\{X \in(-\infty, x]\}=P\{X \leq x\} F ( x ) = P { X ∈ ( − ∞ , x ] } = P { X ≤ x } ,则称 F ( x ) F(x) F ( x ) 为 r ⋅ v X r \cdot v X r ⋅ v X 的分布函数。
分布函数具有如下性质
0 ≤ F ( x ) ≤ 1 0 \leq F(x) \leq 1 0 ≤ F ( x ) ≤ 1 ;
F ( x ) F(x) F ( x ) 是一个单调不减函数;
F ( x ) F(x) F ( x ) 右连续,即 lim x → a + F ( x ) = F ( a ) \lim_{x \rightarrow a^{+}} F(x)=F(a) lim x → a + F ( x ) = F ( a ) ;
lim x → + ∞ F ( x ) = 1 \lim_{x \rightarrow+\infty} F(x)=1 lim x → + ∞ F ( x ) = 1 ,lim x → − ∞ F ( x ) = 0 \lim_{x \rightarrow-\infty} F(x)=0 lim x → − ∞ F ( x ) = 0 。
注意:F ( x ) = P { X ≤ x } F(x)=P\{X\leq x\} F ( x ) = P { X ≤ x } ,F ( x − ) = P { X < x } F(x^-)=P\{X<x\} F ( x − ) = P { X < x } 。
二、离散型随机变量及概率分布
1、离散型随机变量的分布
离散型随机变量:若随机变量的所有可能取值为有限个或可列个,我们称这类随机变量为离散型随机变量。
离散型随机变量的概率分布:设 X 为离散型 r ⋅ v r \cdot v r ⋅ v ,所有可能取值为 x k ( k = 1 , 2 , ⋯ ) x_{k}(k=1,2, \cdots) x k ( k = 1 , 2 , ⋯ ) ,且P { X = x k } = p k ( k = 1 , 2 , ⋯ ) P\{X=x_{k}\} = p_{k} (k=1,2, \cdots) P { X = x k } = p k ( k = 1 , 2 , ⋯ ) 。则称 p k ( k = 1 , 2 , ⋯ ) p_{k}(k=1,2, \cdots) p k ( k = 1 , 2 , ⋯ ) 为 X 的概率分布(分布律)简记为 { p k } 1 ∞ \{p_{k}\}_{1}^{\infty} { p k } 1 ∞ 。
离散型随机变量概率分布 { p k } 1 ∞ \{p_{k}\}_{1}^{\infty} { p k } 1 ∞ 的性质:
p k ≥ 0 ( k = 1 , 2 , ⋯ ) p_{k} \geq 0(k=1,2, \cdots) p k ≥ 0 ( k = 1 , 2 , ⋯ ) ;
∑ k = 1 ∞ p k = 1 \sum_{k=1}^{\infty} p_{k}=1 ∑ k = 1 ∞ p k = 1 。
2、常用的离散型随机变量分布
0-1分布 :若 X 的分布列为
X X X
0
1
P P P
1 − p 1-p 1 − p
p p p
即P { X = k } = p k ( 1 − p ) 1 − k ( k = 0 , 1 ) P\{X=k\}=p^{k}(1-p)^{1-k}(k=0,1) P { X = k } = p k ( 1 − p ) 1 − k ( k = 0 , 1 )
则称 X X X 服从参数为 p p p 的0-1分布,记为 X ∼ B ( 1 , p ) X \sim B(1, p) X ∼ B ( 1 , p ) 。对只含两个样本点的样本空间 Ω = { e 1 , e 2 } \Omega=\{e_{1}, e_{2}\} Ω = { e 1 , e 2 } 总可定义
X = X ( e ) = { 1 , e = e 1 0 , e = e 2 . X=X(e)=\{\begin{array}{ll}
1, & e=e_{1} \\
0, & e=e_{2}
\end{array}. X = X ( e ) = { 1 , 0 , e = e 1 e = e 2 .
二项分布 :若随机试验 E E E 只有两个可能的结果 A A A 与 A ˉ \bar{A} A ˉ ,记 P ( A ) = p P(A)=p P ( A ) = p ,P ( A ˉ ) = 1 − p = q ( 0 < p < 1 ) P(\bar{A})=1-p=q(0<p<1) P ( A ˉ ) = 1 − p = q ( 0 < p < 1 ) ,将试验 E E E 独立地重复进行 n n n 次,则称这一串独立重复试验为n重伯努利试验 。以 X X X 表示 n n n 重贝努利试验中事件 A A A 发生的次数,则 X X X 是一随机变量,X X X 的可能取值为 0 , 1 , 2 , ⋯ , n 0,1,2, \cdots, n 0 , 1 , 2 , ⋯ , n 。 A A A 出现 k k k 次的概率为 P { X = k } = P n ( k ) P\{X=k\}= P_{n}(k) P { X = k } = P n ( k ) 。P { X = k } = C n k p k q n − k ( k = 0 , 1 , 2 , ⋯ , n ) P\{X=k\}=C_{n}^{k} p^{k} q^{n-k}(k=0,1,2, \cdots, n) P { X = k } = C n k p k q n − k ( k = 0 , 1 , 2 , ⋯ , n ) 。则称 X X X 为服从参数n n n ,p p p 的二项分布,记作X ∼ B ( n , p ) X \sim B(n, p) X ∼ B ( n , p ) 。
泊松分布 :如果随机变量 X X X 的所有可能取值为 0 , 1 , 2 , ⋯ 0,1,2, \cdots 0 , 1 , 2 , ⋯ ,其分布律为$$P{X=k}=\frac{\lambda^{k} e^{-\lambda}}{k!} (k=0,1,2, \cdots ; \lambda>0)$$,则称 X X X 服从参数为 λ \lambda λ 的泊松分布,记为 X ∼ P ( λ ) X \sim P(\lambda) X ∼ P ( λ ) 。
泊松分布是概率论中一个重要的离散分布,主要用于描述单位时间或单位空间内随机事件的发生次数。是指数分布的离散版本。此外,泊松分布是二项分布的极限形式,当试验次数n n n 很大,成功概率p p p 很小,且λ = n p \lambda=np λ = n p 为有限值时,二项分布可以用泊松分布近似表示,C n k p k ( 1 − p ) n − k ≈ λ k e − λ k ! C_{n}^{k} p^{k}(1-p)^{n-k} \approx \frac{\lambda^{k} e^{-\lambda}}{k!} C n k p k ( 1 − p ) n − k ≈ k ! λ k e − λ 。
三、连续型随机变量及概率分布
1、连续型随机变量的分布
连续型随机变量:若 r ⋅ v X r\cdot v X r ⋅ v X 的分布函数 F ( x ) F(x) F ( x ) 可表示成F ( x ) = ∫ − ∞ x f ( u ) d u F(x)=\int_{-\infty}^{x} f(u) d u F ( x ) = ∫ − ∞ x f ( u ) d u ,其中 f ( x ) f(x) f ( x ) 为一非负可积 函数,则称 X X X 为连续型随机变量, f ( x ) f(x) f ( x ) 称为 X X X 的概率密度函数 (或概率分布 、分布密度 )。
连续型 r ⋅ v X r\cdot v X r ⋅ v X 的分布函数 F ( x ) F(x) F ( x ) 是连续函数,而概率密度不一定连续。
概率密度 f(x) 具有如下性质:
f ( x ) ≥ 0 f(x) \geq 0 f ( x ) ≥ 0 ;
∫ − ∞ + ∞ f ( x ) d x = 1 \int_{-\infty}^{+\infty} f(x) d x=1 ∫ − ∞ + ∞ f ( x ) d x = 1 ;
P { x 1 < X ≤ x 2 } = F ( x 2 ) − F ( x 1 ) = ∫ x 1 x 2 f ( x ) d x P\{x_{1}<X \leq x_{2}\}=F(x_{2})-F(x_{1})=\int_{x_{1}}^{x_{2}} f(x) d x P { x 1 < X ≤ x 2 } = F ( x 2 ) − F ( x 1 ) = ∫ x 1 x 2 f ( x ) d x ;
若 f ( x ) f(x) f ( x ) 在 x x x 点连续,则 F ′ ( x ) = f ( x ) F^{\prime}(x)=f(x) F ′ ( x ) = f ( x ) 。
注意:与离散型随机变量的分布函数不同,在连续型随机变量的分布中,∀ a ∈ R , P { X = a } = F ( a ) − F ( a − 0 ) = 0 \forall a\in R,P\{X=a\}=F(a)-F(a-0)=0 ∀ a ∈ R , P { X = a } = F ( a ) − F ( a − 0 ) = 0 ;
2、常用的连续型随机变量分布
均匀分布 :
设随机变量 X X X 在有限区间 [ a , b ] [a, b] [ a , b ] 内取值,且其分布密度为 $$f(x)={\begin{array}{cc}\frac{1}{b-a}, & a \leq x \leq b \ 0, & \text { 其他 }\end{array}.$$ ,则称 X X X 在有限区间 [ a , b ] [a, b] [ a , b ] 上服从均匀分布,记为 X ∼ U ( a , b ) X \sim U(a, b) X ∼ U ( a , b ) 。其分布函数为
F ( x ) = { 0 , x < a x − a b − a , a ≤ x < b 1 , x ≥ b . F(x)=\{\begin{array}{cc}
0, & x<a \\
\frac{x-a}{b-a}, & a \leq x<b \\
1, & x \geq b
\end{array}. F ( x ) = { 0 , b − a x − a , 1 , x < a a ≤ x < b x ≥ b .
指数分布 :
若随机变量 X X X 的概率密度
f ( x ) = { λ e − λ x , x > 0 0 , x ≤ 0 . f(x)=\{\begin{array}{ll}
\lambda e^{-\lambda x}, & x>0 \\
0, & x \leq 0
\end{array}. f ( x ) = { λ e − λ x , 0 , x > 0 x ≤ 0 .
其中 λ > 0 \lambda>0 λ > 0 为常数,则称 X X X 服从参数为 λ \lambda λ 的指数分布,记为 X ∼ e ( λ ) X \sim e(\lambda) X ∼ e ( λ ) 。分布函数为
F ( x ) = { 0 , x < 0 1 − e − λ x , x ≥ 0 . F(x)=\{\begin{array}{l}
0, x<0 \\
1-e^{-\lambda x}, x \geq 0
\end{array}. F ( x ) = { 0 , x < 0 1 − e − λ x , x ≥ 0 .
指数分布是概率论中一种重要的分布,用来描述事件发生的时间间隔。
正态分布 :若随机变量 X X X 的分布密度为$$f(x)=\frac{1}{\sqrt{2 \pi} \sigma} e^{-\frac{1}{2 \sigma{2}}(x-\mu) {2}} (-\infty<x<+\infty)$$
其中 μ \mu μ ,σ ( σ > 0 ) \sigma(\sigma>0) σ ( σ > 0 ) 为常数,则称 X X X 服从参数为 μ \mu μ ,σ \sigma σ 的正态分布或高斯分布,记为 X ∼ N ( μ , σ 2 ) X \sim N(\mu, \sigma^{2}) X ∼ N ( μ , σ 2 ) 。分布函数为
F ( x ) = ∫ − ∞ x 1 2 π σ e − 1 2 σ 2 ( t − μ ) 2 d t F(x)=\int_{-\infty}^{x} \frac{1}{\sqrt{2 \pi} \sigma} e^{-\frac{1}{2 \sigma^{2}}(t-\mu)^{2}} d t
F ( x ) = ∫ − ∞ x 2 π σ 1 e − 2 σ 2 1 ( t − μ ) 2 d t
特别地,当 μ = 0 \mu=0 μ = 0 ,σ = 1 \sigma=1 σ = 1 时,图形关于 x = 0 x=0 x = 0 对称,此时称 X 服从标准正态分布,记为 X ∼ N ( 0 , 1 ) X \sim N(0,1) X ∼ N ( 0 , 1 ) 。密度函数变为
φ ( x ) = 1 2 π e − 1 2 x 2 ( − ∞ < x < + ∞ ) \varphi(x)=\frac{1}{\sqrt{2 \pi}} e^{-\frac{1}{2} x^{2}} (-\infty<x<+\infty)
φ ( x ) = 2 π 1 e − 2 1 x 2 ( − ∞ < x < + ∞ )
其分布函数为 $$\Phi(x)=\int_{-\infty}^{x} \frac{1}{\sqrt{2 \pi}} e^{-\frac{1}{2} t^{2}} d t (-\infty<x<+\infty)$$ 正态分布的性质如下:
X − μ σ ∼ N ( 0 , 1 ) \frac {X-\mu}{\sigma} \sim N(0,1) σ X − μ ∼ N ( 0 , 1 ) ,这反映了一般正态分布与标准正态分布的关系,由此可得,F ( x ) = Φ ( x − μ σ ) F(x)=\Phi(\frac{x-\mu}{\sigma}) F ( x ) = Φ ( σ x − μ ) 。
φ ( − x ) = φ ( x ) \varphi(-x)=\varphi(x) φ ( − x ) = φ ( x ) ,Φ ( − x ) = 1 − Φ ( x ) \Phi(-x)=1-\Phi(x) Φ ( − x ) = 1 − Φ ( x ) 。
四、随机向量及其分布
1、二维随机变量及其联合分布
随机向量:一般地,设 X 1 , X 2 , ⋯ , X n X_{1}, X_{2}, \cdots, X_{n} X 1 , X 2 , ⋯ , X n 为定义同一个样本空间上的r ⋅ v r \cdot v r ⋅ v ,称X = ( X 1 , X 2 , ⋯ , X n ) X=(X_{1}, X_{2}, \cdots, X_{n}) X = ( X 1 , X 2 , ⋯ , X n ) 为 n n n 维随机向量或 n n n 维 r ⋅ v r \cdot v r ⋅ v 。
设 ( X , Y ) (X, Y) ( X , Y ) 为二维 r ⋅ v r \cdot v r ⋅ v ,∀ x , y ∈ R \forall x, y \in R ∀ x , y ∈ R ,称F ( x , y ) = P { X ≤ x , Y ≤ y } F(x, y)=P\{X \leq x, Y \leq y\} F ( x , y ) = P { X ≤ x , Y ≤ y } 为随机向量 ( X , Y ) (X, Y) ( X , Y ) 的分布函数,或随机变量 X X X 和 Y Y Y 的联合分布函数。
F ( x , y ) F(x, y) F ( x , y ) 有如下性质:
0 ≤ F ( x , y ) ≤ 1 0 \leq F(x, y) \leq 1 0 ≤ F ( x , y ) ≤ 1 ;且
对任意固定的 y y y ,F ( − ∞ , y ) = 0 F(-\infty, y)=0 F ( − ∞ , y ) = 0 ;
对任意固定的 x x x ,F ( x , − ∞ ) = 0 F(x,-\infty)=0 F ( x , − ∞ ) = 0 ;
及 F ( − ∞ , − ∞ ) = 0 F(-\infty,-\infty)=0 F ( − ∞ , − ∞ ) = 0 ; F ( + ∞ , + ∞ ) = 1 F(+\infty,+\infty)=1 F ( + ∞ , + ∞ ) = 1 ;
F ( x , y ) F(x, y) F ( x , y ) 是变量 x x x 和 y y y 的不减函数;
F ( x , y ) F(x, y) F ( x , y ) 关于变量 x x x 和变量 y y y 右连续;
∀ x 1 < x 2 , y 1 < y 2 \forall x_{1}<x_{2}, y_{1}<y_{2} ∀ x 1 < x 2 , y 1 < y 2 有F ( x 2 , y 2 ) − F ( x 2 , y 1 ) − F ( x 1 , y 2 ) + F ( x 1 , y 1 ) ≥ 0 F(x_{2}, y_{2})-F(x_{2}, y_{1})-F(x_{1}, y_{2})+F(x_{1}, y_{1}) \geq 0 F ( x 2 , y 2 ) − F ( x 2 , y 1 ) − F ( x 1 , y 2 ) + F ( x 1 , y 1 ) ≥ 0 。
二维离散型随机变量:如果 ( X , Y ) (X, Y) ( X , Y ) 的所有可能取值是有限个或可列无穷个,记为 ( x i , y j ) ( i , j = 1 , 2 , 3 , ⋯ ) (x_{i}, y_{j})(i, j=1,2,3, \cdots) ( x i , y j ) ( i , j = 1 , 2 , 3 , ⋯ ) ,则称 ( X , Y ) (X, Y) ( X , Y ) 为二维离散型 r ⋅ v r \cdot v r ⋅ v 。并称P { X = x i , Y = y j } = p i j ( i , j = 1 , 2 , 3 , ⋯ ) P\{X=x_{i}, Y=y_{j}\} = p_{i j} (i, j=1,2,3, \cdots) P { X = x i , Y = y j } = p i j ( i , j = 1 , 2 , 3 , ⋯ ) 为二维离散型 r ⋅ v ( X , Y ) r \cdot v(X, Y) r ⋅ v ( X , Y ) 的分布律或 X X X 与 Y Y Y 的联合分布律。 X X X 与 Y Y Y 的联合分布律也可用概率分布表表示。
二维连续型随机变量:对于二维随机变量 ( X , Y ) (X, Y) ( X , Y ) ,F ( x , y ) F(x, y) F ( x , y ) 为 ( X , Y ) (X, Y) ( X , Y ) 的分布函数。若存在非负可积函数 f ( x , y ) f(x, y) f ( x , y ) ,使对任意实数 x x x 、y y y 有F ( x , y ) = ∫ − ∞ x ∫ − ∞ y f ( u , v ) d u d v F(x, y)=\int_{-\infty}^{x} \int_{-\infty}^{y} f(u, v) d u d v F ( x , y ) = ∫ − ∞ x ∫ − ∞ y f ( u , v ) d u d v ,则称 ( X , Y ) (X, Y) ( X , Y ) 为二维连续型随机变量,f ( x , y ) f(x, y) f ( x , y ) 称为 ( X , Y ) (X, Y) ( X , Y ) 的概率密度或 X X X 、Y Y Y 的联合概率密度。
概率密度 f ( x , y ) f(x, y) f ( x , y ) 有如下性质:
f ( x , y ) ≥ 0 f(x, y) \geq 0 f ( x , y ) ≥ 0 ;
∫ − ∞ + ∞ ∫ − ∞ + ∞ f ( x , y ) d x d y = 1 \int_{-\infty}^{+\infty} \int_{-\infty}^{+\infty} f(x, y) d x d y=1 ∫ − ∞ + ∞ ∫ − ∞ + ∞ f ( x , y ) d x d y = 1 ;
若 f ( x , y ) f(x, y) f ( x , y ) 在点 ( x , y ) (x, y) ( x , y ) 处连续,则f ( x , y ) = ∂ 2 F ( x , y ) ∂ x ∂ y f(x, y)=\frac{\partial^{2} F(x, y)}{\partial x \partial y} f ( x , y ) = ∂ x ∂ y ∂ 2 F ( x , y ) ;
设 G G G 为一平面区域,则P { ( X , Y ) ∈ G } = ∬ G f ( x , y ) d x d y P\{(X, Y) \in G\}=\iint_{G} f(x, y) d x d y P { ( X , Y ) ∈ G } = ∬ G f ( x , y ) d x d y 。特别地,P { x 1 < X ≤ x 2 , y 1 < Y ≤ y 2 } = ∫ x 1 x 2 ∫ y 1 y 2 f ( x , y ) d x d y P\{x_{1}<X \leq x_{2}, y_{1}<Y \leq y_{2}\}=\int_{x_{1}}^{x_{2}} \int_{y_{1}}^{y_{2}} f(x, y) d x d y P { x 1 < X ≤ x 2 , y 1 < Y ≤ y 2 } = ∫ x 1 x 2 ∫ y 1 y 2 f ( x , y ) d x d y 。
2、二维随机变量的边缘分布
边缘分布函数:设 ( X , Y ) (X, Y) ( X , Y ) 的分布函数 F ( x , y ) F(x, y) F ( x , y ) ,则关于 X X X 和关于 Y Y Y 的边缘分布函数分别为
F X ( x ) = F ( x , + ∞ ) = lim y → + ∞ F ( x , y ) F Y ( y ) = F ( + ∞ , y ) = lim x → + ∞ F ( x , y ) \begin{array}{l}
F_{X}(x)=F(x,+\infty)=\lim _{y \rightarrow+\infty} F(x, y) \\
F_{Y}(y)=F(+\infty, y)=\lim _{x \rightarrow+\infty} F(x, y)
\end{array} F X ( x ) = F ( x , + ∞ ) = lim y → + ∞ F ( x , y ) F Y ( y ) = F ( + ∞ , y ) = lim x → + ∞ F ( x , y )
设 ( X , Y ) (X, Y) ( X , Y ) 为离散型 r ⋅ v r\cdot v r ⋅ v ,其分布律为P { X = x i , Y = y j } = p i j ( i , j = 1 , 2 , 3 , ⋯ ) P\{X=x_{i}, Y=y_{j}\} = p_{i j} (i, j=1,2,3, \cdots) P { X = x i , Y = y j } = p i j ( i , j = 1 , 2 , 3 , ⋯ ) ,则关于 X 和关于 Y 的边缘分布律分别为
P { X = x i } = ∑ j = 1 ∞ p i j = p i . ( i = 1 , 2 , 3 , ⋯ ) P { Y = y j } = ∑ i = 1 ∞ p i j = p ⋅ j ( j = 1 , 2 , 3 , ⋯ ) \begin{array}{l}
P\{X=x_{i}\}=\sum_{j=1}^{\infty} p_{i j} = p_{i .} (i=1,2,3, \cdots) \\
P\{Y=y_{j}\}=\sum_{i=1}^{\infty} p_{i j} = p_{\cdot j} (j=1,2,3, \cdots)
\end{array} P { X = x i } = ∑ j = 1 ∞ p i j = p i . ( i = 1 , 2 , 3 , ⋯ ) P { Y = y j } = ∑ i = 1 ∞ p i j = p ⋅ j ( j = 1 , 2 , 3 , ⋯ )
设 ( X , Y ) (X, Y) ( X , Y ) 为连续型 r ⋅ v r\cdot v r ⋅ v ,概率密度为 f ( x , y ) f(x, y) f ( x , y ) ,则关于 X X X 和关于 Y Y Y 的边缘分布密度分别为
f X ( x ) = ∫ − ∞ + ∞ f ( x , y ) d y f Y ( y ) = ∫ − ∞ + ∞ f ( x , y ) d x \begin{aligned}
f_{X}(x) & =\int_{-\infty}^{+\infty} f(x, y) d y \\
f_{Y}(y) & =\int_{-\infty}^{+\infty} f(x, y) d x
\end{aligned} f X ( x ) f Y ( y ) = ∫ − ∞ + ∞ f ( x , y ) d y = ∫ − ∞ + ∞ f ( x , y ) d x
3、二维随机变量的条件分布
二维离散型随机变量的条件分布律:
设 ( X , Y ) (X, Y) ( X , Y ) 为离散型随机变量,对于固定的 j j j ,若P { Y = y j } > 0 P\{Y=y_j\}>0 P { Y = y j } > 0 ,则称$$P{X=x_{i} \mid Y=y_{j}}=\frac{P{X=x_{i}, Y=y_{j}}}{P{Y=y_{j}}}=\frac{p_{i j}}{p_{\cdot j}}(i=1,2,3, \cdots)$$为在 Y = y j Y=y_{j} Y = y j 的条件下随机变量 X X X 的条件分布律。
同样地,可定义 Y Y Y 的条件分布律,称
P { Y = y j ∣ X = x i } = P { X = x i , Y = y j } P { X = x i } = p i j p i . ( j = 1 , 2 , 3 , ⋯ ) P\{Y=y_{j} \mid X=x_{i}\}=\frac{P\{X=x_{i}, Y=y_{j}\}}{P\{X=x_{i}\}}=\frac{p_{i j}}{p_{i} .}(j=1,2,3, \cdots)
P { Y = y j ∣ X = x i } = P { X = x i } P { X = x i , Y = y j } = p i . p i j ( j = 1 , 2 , 3 , ⋯ )
为在 X = x i X=x_{i} X = x i 的条件下随机变量 Y Y Y 的条件分布律。
即$$条件分布律=\frac{联合分布律}{边缘分布律}$$
二维连续性随机变量的条件概率密度:
设( X , Y ) (X,Y) ( X , Y ) 为连续型随机变量,其概率密度为f ( x , y ) f(x,y) f ( x , y ) ,边缘概率密度分别为f X ( x ) f_X(x) f X ( x ) 和f Y ( y ) f_Y(y) f Y ( y ) 。若f Y ( y ) ≠ 0 f_Y(y)\ne 0 f Y ( y ) = 0 ,则称f X ∣ Y ( x ∣ y ) = f ( x , y ) f Y ( y ) f_{X \mid Y}(x \mid y)=\frac{f(x, y)}{f_{Y}(y)} f X ∣ Y ( x ∣ y ) = f Y ( y ) f ( x , y ) 为在Y = y Y=y Y = y 条件下X X X 的条件概率密度。则F X ∣ Y ( x ∣ y ) = ∫ − ∞ x f X ∣ Y ( x ∣ y ) d x F_{X \mid Y}(x \mid y)=\int_{-\infty}^{x} f_{X \mid Y}(x \mid y) d x F X ∣ Y ( x ∣ y ) = ∫ − ∞ x f X ∣ Y ( x ∣ y ) d x 。
同理,若f X ( x ) ≠ 0 f_X(x)\ne 0 f X ( x ) = 0 ,则称f Y ∣ Y ( y ∣ x ) = f ( x , y ) f X ( x ) f_{Y \mid Y}(y \mid x)=\frac{f(x, y)}{f_{X}(x)} f Y ∣ Y ( y ∣ x ) = f X ( x ) f ( x , y ) 为在X = x X=x X = x 条件下Y Y Y 的条件概率密度。则F Y ∣ X ( y ∣ x ) = ∫ − ∞ y f Y ∣ X ( y ∣ x ) d y F_{Y \mid X}(y \mid x) =\int_{-\infty}^{y} f_{Y \mid X}(y \mid x) d y F Y ∣ X ( y ∣ x ) = ∫ − ∞ y f Y ∣ X ( y ∣ x ) d y 。
4、常用的二维连续型随机变量分布
二维均匀分布 :
设 G G G 为一平面区域,G G G 的面积为 A ( 0 < A < + ∞ ) A(0<A<+\infty) A ( 0 < A < + ∞ ) ,若 ( X , Y ) (X, Y) ( X , Y ) 的概率密度为
f ( x , y ) = { 1 / A , ( x , y ) ∈ G 0 , 其他 . f(x, y)=\{\begin{array}{cc}
1 / A, & (x, y) \in G \\
0, & \text { 其他 }
\end{array}. f ( x , y ) = { 1 / A , 0 , ( x , y ) ∈ G 其他 .
则称 ( X , Y ) (X, Y) ( X , Y ) 在 G G G 上服从均匀分布,记为( X , Y ) ∼ U ( G ) (X, Y) \sim U(G) ( X , Y ) ∼ U ( G ) 。
二维正态分布 :
如果 (X, Y) 的概率密度为f ( x , y ) = 1 2 π σ 1 σ 2 1 − ρ 2 exp { ∙ } ( − ∞ < x , y < + ∞ ) f(x, y)=\frac{1}{2 \pi \sigma_{1} \sigma_{2} \sqrt{1-\rho^{2}}} \exp \{\bullet\} (-\infty<x, y<+\infty) f ( x , y ) = 2 π σ 1 σ 2 1 − ρ 2 1 exp { ∙ } ( − ∞ < x , y < + ∞ ) ,其中exp { ∙ } = exp { − 1 2 ( 1 − ρ 2 ) [ ( x − μ 1 σ 1 ) 2 − 2 ρ ( x − μ 1 ) ( y − μ 2 ) σ 1 σ 2 + ( y − μ 2 σ 2 ) 2 ] } \exp \{\bullet\}=\exp \left\{\frac{-1}{2\left(1-\rho^{2}\right)}\left[\left(\frac{x-\mu_{1}}{\sigma_{1}}\right)^{2}-2 \rho \frac{\left(x-\mu_{1}\right)\left(y-\mu_{2}\right)}{\sigma_{1} \sigma_{2}}+\left(\frac{y-\mu_{2}}{\sigma_{2}}\right)^{2}\right]\right\} exp { ∙ } = exp { 2 ( 1 − ρ 2 ) − 1 [ ( σ 1 x − μ 1 ) 2 − 2 ρ σ 1 σ 2 ( x − μ 1 ) ( y − μ 2 ) + ( σ 2 y − μ 2 ) 2 ] } 。则称 ( X , Y ) (X, Y) ( X , Y ) 服从参数为 μ 1 \mu_{1} μ 1 ,μ 2 \mu_{2} μ 2 ,σ 1 ( σ 1 > 0 ) \sigma_{1}(\sigma_{1}>0) σ 1 ( σ 1 > 0 ) ,σ 2 ( σ 2 > 0 ) \sigma_{2}(\sigma_{2}>0) σ 2 ( σ 2 > 0 ) ,ρ ( ∣ ρ ∣ < 1 ) \rho(|\rho|<1) ρ ( ∣ ρ ∣ < 1 ) 的二维正态分布。( X , Y ) ∼ N ( μ 1 , μ 2 ; σ 1 2 , σ 2 2 ; ρ ) (X, Y) \sim N(\mu_{1}, \mu_{2} ; \sigma_{1}^{2}, \sigma_{2}^{2} ; \rho) ( X , Y ) ∼ N ( μ 1 , μ 2 ; σ 1 2 , σ 2 2 ; ρ ) 。
二维正态分布的性质:
设( X , Y ) ∼ N ( μ 1 , μ 2 ; σ 1 2 , σ 2 2 ; ρ ) (X, Y) \sim N(\mu_{1}, \mu_{2} ; \sigma_{1}^{2}, \sigma_{2}^{2} ; \rho) ( X , Y ) ∼ N ( μ 1 , μ 2 ; σ 1 2 , σ 2 2 ; ρ ) ,则
两个边缘分布均为正态分布,X ∼ N ( μ 1 , σ 1 2 ) X\sim N(\mu_1,\sigma_1^2) X ∼ N ( μ 1 , σ 1 2 ) ,Y ∼ N ( μ 2 , σ 2 2 ) Y\sim N(\mu_2,\sigma_2^2) Y ∼ N ( μ 2 , σ 2 2 ) ;
X X X 与Y Y Y 相互独立的充分必要条件为ρ = 0 \rho =0 ρ = 0 ;
X X X 与Y Y Y 的非零线性组合( a X + b Y , c X + d Y ) (aX+bY,cX+dY) ( a X + b Y , c X + d Y ) 服从二维正态分布。
五、随机变量的独立性
二维随机变量的独立性:
设 F ( x , y ) F(x, y) F ( x , y ) 、 F X ( x ) F_{X}(x) F X ( x ) 和 F Y ( y ) F_{Y}(y) F Y ( y ) ,依次为 ( X , Y ) (X, Y) ( X , Y ) 的分布函数、边缘分布函数。若对任意的实数 x , y x, y x , y 有F ( x , y ) = F X ( x ) ⋅ F Y ( y ) F(x, y)=F_{X}(x) \cdot F_{Y}(y) F ( x , y ) = F X ( x ) ⋅ F Y ( y ) ,即 P { X ≤ x , Y ≤ y } = P { X ≤ x } ⋅ P { Y ≤ y } P\{X \leq x, Y \leq y\}=P\{X \leq x\} \cdot P\{Y \leq y\} P { X ≤ x , Y ≤ y } = P { X ≤ x } ⋅ P { Y ≤ y } ,则称随机变量 X X X 与 Y Y Y 相互独立。
当 ( X , Y ) (X, Y) ( X , Y ) 为离散型 r ⋅ v r\cdot v r ⋅ v 时,上面的条件等价于P { X = x i , Y = y j } = P { X = x i } ⋅ P { Y = y j } P\{X=x_{i}, Y=y_{j}\}=P\{X=x_{i}\} \cdot P\{Y=y_{j}\} P { X = x i , Y = y j } = P { X = x i } ⋅ P { Y = y j } ,简记 p i j = p i ⋅ ⋅ p ⋅ j ( i , j = 1 , 2 , 3 , ⋯ ) p_{i j}=p_{i \cdot} \cdot p_{\cdot j}(i, j=1,2,3, \cdots) p i j = p i ⋅ ⋅ p ⋅ j ( i , j = 1 , 2 , 3 , ⋯ ) 。
六、随机变量函数的分布
1、离散型随机变量函数的分布
离散型随机变量的函数的分布一般都是求分布律,只要根据表格逐项计算即可。
2、连续型随机变量函数的分布
设 X X X 为连续型随机变量,其分布密度为 f ( x ) f(x) f ( x ) ,y = g ( x ) y=g(x) y = g ( x ) 是一处处可导 而且严格单调 函数,则 Y = g ( X ) Y=g(X) Y = g ( X ) 是连续型随机变量,其分布密度为
f_{Y}(y)=\{\begin{array}{cc}
f[h(y)]|h^{\prime}(y)|, & \alpha<y<\beta \\
0, & \text { 其他 }
\end{array}.$$其中 $h(y)$ 是 $g(x)$ 的反函数,$\alpha=\min \{g(-\infty), g(+\infty)\}$,$\beta=\max \{g(-\infty), g(+\infty)\}$ 。
##### 3、二维随机变量函数的分布
$(X, Y)$ 为二维 $r\cdot v$,$z=g(x, y)$ 为连续函数,则称 $Z=g(X, Y)$ 为 $(X, Y)$ 的函数。$Z$ 的分布函数为$F_{Z}(z)=P\{Z \leq z\}=P\{g(X, Y) \leq z\}$,此时有两种求解方法:
- 定义法:$F_{Z}(z)=P\{Z \leq z\}=\iint_{g(x, y) \leq z} f(x, y) d x d y$,由此得 Z 的分布密度为$f_{Z}(z)=\frac{d F_{Z}(z)}{d z}=\frac{d}{d z} \iint_{g(x, y) \leq z} f(x, y) d x d y$。
- 卷积公式法:若Z=g(X,Y)是X,Y的线性函数,可反解出Y=h(X,Z)(或X=s(Y,Z)),则Z的概率密度为$$f_{Z}(z)=\int_{-\infty}^{+\infty} f(x, h(x,z))|\frac{\partial[h(x,z)]}{\partial z}| dx$$或$$f_{Z}(z)=\int_{-\infty}^{+\infty} f(s(y,z), y)|\frac{\partial[s(y,z)]}{\partial z}| dy