概率论基础
1.概率论
1.1 随机事件与概率
1.1.1 基本概念
样本点(sample point): 称为试验 S S S的可能结果为样本点,用 ω \omega ω表示。
样本空间(sample space):称试验
S
S
S的样本点构成的集合为样本空间,用
Ω
\Omega
Ω表示。于是
Ω
=
{
ω
∣
ω
是试验
S
的样本点
}
\begin{aligned} \Omega = \{\omega|\omega是试验S的样本点\} \end {aligned}
Ω={ω∣ω是试验S的样本点}
事件(event): 设 Ω \Omega Ω是试验 S S S的样本空间。当 Ω \Omega Ω中只有有限个样本点时,称 Ω \Omega Ω的子集为事件。当试验的样本点(试验结果) ω \omega ω落在 A A A中,称事件 A A A发生,否则称 A A A不发生。
按照上述约定,子集符号 A ⊂ Ω A \subset \Omega A⊂Ω表示 A A A是事件。通常用大写字母 A , B , C , D A,B,C,D A,B,C,D等表示事件。
用 A ‾ = Ω − A \overline{A}=\Omega-A A=Ω−A表示集合 A A A的余集。则事件 A A A发生和样本点 ω ∈ A \omega \in A ω∈A是等价的,事件 A A A不发生和样本点 ω ∈ A ‾ \omega \in \overline{A} ω∈A是等价的。
空集 ∅ \emptyset ∅是 Ω \Omega Ω的子集,由于 ∅ \emptyset ∅中没有样本点,永远不会发生,所以称 ∅ \emptyset ∅是不可能事件。 Ω \Omega Ω也是样本空间 Ω \Omega Ω的子集,包含了所有的样本点,因而总会发生。我们称 Ω \Omega Ω是必然事件。
基本事件: 由一个样本点组成的子集。
1.1.2 事件间的关系和运算
1. 事件关系
事件关系 | 概念 | 表示 |
---|---|---|
事件包含 | A A A发生则 B B B必发生 | A ⊂ B A \subset B A⊂B,特别的, A ⊂ B A \subset B A⊂B且 B ⊂ A B \subset A B⊂A,则 A = B A=B A=B |
事件的并 | A A A和 B B B至少有一个发生 | A ∪ B A \cup B A∪B |
事件的交 | A A A和 B B B同时发生 | A ∩ B A \cap B A∩B或 A B AB AB |
事件的差 | A A A发生而 B B B不发生 | A − B A - B A−B |
互斥事件 | A A A和 B B B不能同时发生 | A ∩ B = ∅ A \cap B=\emptyset A∩B=∅或 A B = ∅ AB=\emptyset AB=∅ |
对立事件 | A A A和 B B B必有一个发生,且仅有一个, A A A的对立事件 A ‾ \overline{A} A | A A ‾ = ∅ A\overline{A}=\emptyset AA=∅且 A ∪ A ‾ = Ω A \cup \overline{A}=\Omega A∪A=Ω |
2. 运算规律
交换律: A ∪ B = B ∪ A A \cup B=B \cup A A∪B=B∪A, A ∩ B = B ∩ A A \cap B=B \cap A A∩B=B∩A
结合律: ( A ∪ B ) ∪ C = A ∪ ( B ∪ C ) (A \cup B) \cup C=A \cup (B \cup C) (A∪B)∪C=A∪(B∪C), ( A ∩ B ) ∩ C = A ∩ ( B ∩ C ) (A \cap B) \cap C=A \cap (B \cap C) (A∩B)∩C=A∩(B∩C)
分配律: A ∩ ( B ∪ C ) = ( A ∩ B ) ∪ ( A ∩ C ) A \cap (B \cup C)=(A \cap B)\cup(A \cap C) A∩(B∪C)=(A∩B)∪(A∩C), A ∪ ( B ∩ C ) = ( A ∪ B ) ∩ ( A ∪ C ) A \cup (B \cap C)=(A \cup B)\cap(A \cup C) A∪(B∩C)=(A∪B)∩(A∪C), A ( B − C ) = A B − A C A(B-C)=AB-AC A(B−C)=AB−AC
吸收律:若 A ⊂ B A \subset B A⊂B,则 A B = A , A ∪ B = B AB=A,A \cup B=B AB=A,A∪B=B
德摩根律: A ∪ B ‾ = A ‾ ∩ B ‾ \overline{A \cup B}=\overline{A} \cap \overline{B} A∪B=A∩B, A ∩ B ‾ = A ‾ ∪ B ‾ \overline{A \cap B}=\overline{A} \cup \overline{B} A∩B=A∪B
减法公式: A − B = A − A B = A B ‾ A-B=A-AB=A \overline{B} A−B=A−AB=AB
1.1.3 概率
频率: 相同条件下,进行 n n n次试验,事件 A A A发生的次数 k k k和试验总次数的比 k / n k/n k/n称为频率。频率是个有限次概念
概率: 设 E E E是随机试验, S S S是他的样本空间,对于 E E E的每一事件 A A A赋予一个实数,记为 P ( A ) P(A) P(A),称为事件 A A A的频率
频率的性质:
非负性: 0 ≤ P ( A ) ≤ 1 0 \le P(A) \le 1 0≤P(A)≤1
规范性: P ( Ω ) = 1 , P ( ∅ ) = 0 P(\Omega)=1,P(\emptyset)=0 P(Ω)=1,P(∅)=0
可加可列性: A 1 , A 2 , . . . , A n A_{1},A_{2},...,A_{n} A1,A2,...,An两两互不相容(即 A i A j = ∅ A_{i}A_{j}=\emptyset AiAj=∅),有 P ( A 1 A 2 . . . A n ) = P ( A 1 ) + P ( A 2 ) + . . . + P ( A n ) P(A_{1}A_{2}...A_{n})=P(A_{1})+P(A_{2})+...+P(A_{n}) P(A1A2...An)=P(A1)+P(A2)+...+P(An)
1.1.4古典概型(等可能概型)
条件: 1)有限个样本点;2)等可能性
P
(
A
)
=
A
所包含的样本点数
样本总数
=
A
n
n
\begin{aligned} P(A)=\frac{A所包含的样本点数}{样本总数}=\frac{A_{n}}{n} \end{aligned}
P(A)=样本总数A所包含的样本点数=nAn
1.1.5 几何概型
条件: 1)无限样本点;2)等可能性
p
(
A
)
=
μ
A
μ
Ω
,
μ
表示几何大小的度量。
\begin{aligned} p(A)=\frac{\mu_{A}}{\mu_{\Omega}},\mu表示几何大小的度量。 \end{aligned}
p(A)=μΩμA,μ表示几何大小的度量。
1.1.6 条件概率
P
(
B
∣
A
)
P(B|A)
P(B∣A)表示在事件
A
A
A发生的条件下,事件
B
B
B发生的概率。
P
(
B
∣
A
)
=
P
(
A
B
)
P
(
A
)
⇒
P
(
A
B
)
=
P
(
A
)
P
(
B
∣
A
)
\begin{aligned} P(B|A)=\frac{P(AB)}{P(A)} \Rightarrow P(AB)=P(A)P(B|A) \end{aligned}
P(B∣A)=P(A)P(AB)⇒P(AB)=P(A)P(B∣A)
一些公式:
P
(
B
∪
C
∣
A
)
=
P
(
B
∣
A
)
+
P
(
C
∣
A
)
−
P
(
B
C
∣
A
)
当
B
∩
C
=
∅
时,
P
(
B
∪
C
∣
A
)
=
P
(
B
∣
A
)
+
P
(
C
∣
A
)
\begin{aligned} P(B \cup C|A)=P(B|A)+P(C|A)-P(BC|A)\\ 当B \cap C=\emptyset时,P(B \cup C|A)=P(B|A)+P(C|A) \end{aligned}
P(B∪C∣A)=P(B∣A)+P(C∣A)−P(BC∣A)当B∩C=∅时,P(B∪C∣A)=P(B∣A)+P(C∣A)
P ( B − C ∣ A ) = P ( B ∣ A ) − P ( B C ∣ A ) \begin{aligned} P(B-C|A)=P(B|A)-P(BC|A) \end{aligned} P(B−C∣A)=P(B∣A)−P(BC∣A)
P ( B ‾ ∣ A ) = 1 − P ( B ∣ A ) \begin{aligned} P(\overline{B}|A)=1-P(B|A) \end{aligned} P(B∣A)=1−P(B∣A)
1.1.7 重要公式
1. 五大公式:
加法公式: P ( A ∪ B ) = P ( A ) + P ( B ) − P ( A B ) P(A \cup B)=P(A)+P(B)-P(A B) P(A∪B)=P(A)+P(B)−P(AB)
减法公式: P ( A − B ) = P ( A ) − P ( A B ) P(A-B)=P(A)-P(A B) P(A−B)=P(A)−P(AB)
乘法公式: P ( A B ) = P ( A ) P ( B ∣ A ) P(A B)=P(A) P(B \mid A) P(AB)=P(A)P(B∣A), P ( A B C ) = P ( C ∣ A B ) P ( B ∣ A ) P ( A ) P(ABC)=P(C|AB)P(B|A)P(A) P(ABC)=P(C∣AB)P(B∣A)P(A),
P ( A 1 A 2 ⋯ A n ) = P ( A 1 ) P ( A 2 ∣ A 1 ) ⋯ P ( A n ∣ A 1 A 2 ⋯ A n − 1 ) P\left(A_1 A_2 \cdots A_n\right)=P\left(A_1\right) P\left(A_2 \mid A_1\right) \cdots P\left(A_n \mid A_1 A_2 \cdots A_{n-1}\right) P(A1A2⋯An)=P(A1)P(A2∣A1)⋯P(An∣A1A2⋯An−1)
全概率公式: P ( B ) = ∑ i = 1 n P ( A i ) P ( B ∣ A i ) P(B)=\sum_{i=1}^n P\left(A_i\right) P\left(B \mid A_i\right) P(B)=∑i=1nP(Ai)P(B∣Ai)
贝叶斯公式: P ( A i ∣ B ) = P ( A i B ) P ( B ) = P ( A i ) P ( B ∣ A i ) ∑ i = 1 n P ( A i ) P ( B ∣ A i ) P\left(A_i \mid B\right)=\frac{P\left(A_i B\right)}{P(B)}=\frac{P\left(A_i\right) P\left(B \mid A_i\right)}{\sum_{i=1}^n P\left(A_i\right) P\left(B \mid A_i\right)} P(Ai∣B)=P(B)P(AiB)=∑i=1nP(Ai)P(B∣Ai)P(Ai)P(B∣Ai)
2. 独立: P ( A B ) = P ( A ) P ( B ) P(A B)=P(A) P(B) P(AB)=P(A)P(B)
3. 排列组合:
排列
A
n
r
=
n
(
n
−
1
)
⋯
(
n
−
r
+
1
)
A_n^r=n(n-1) \cdots(n-r+1)
Anr=n(n−1)⋯(n−r+1)
从
n
n
n 个不同的元素中任取
r
r
r 个, 按一定顺序排成一列组合
C
n
r
=
n
!
(
n
−
r
)
!
r
!
=
A
n
r
r
!
C_n^r=\frac{n !}{(n-r) ! r !}=\frac{A_n^r}{r !}
Cnr=(n−r)!r!n!=r!Anr
从
n
n
n 个不同的元素中任取
r
r
r 个, 不计顺序排成一组
4. 伯努利试验: P ( X = k ) = C N K p k ( 1 − p ) n − k P(X=k)=C_N^K p^k(1-p)^{n-k} P(X=k)=CNKpk(1−p)n−k
1.1.8 常见分布
1. 0-1分布: X ∼ ( 1 0 P 1 − P ) \quad X \sim\left(\begin{array}{cc}1 & 0 \\ P & 1-P\end{array}\right) X∼(1P01−P)
2. 二项分布:
二项分布
{
1.
独立
2.
P
(
A
)
=
P
3.
只有
A
,
A
ˉ
,
非白即黑
\left\{\begin{array}{l}1 . \text { 独立 } \\ 2 . P(A)=P \\ 3 . \text { 只有 } A, \bar{A}, \text { 非白即黑 }\end{array}\right.
⎩
⎨
⎧1. 独立 2.P(A)=P3. 只有 A,Aˉ, 非白即黑
记
X
X
X 为
A
A
A 发生的次数,
P
{
x
=
k
}
=
C
n
k
P
k
(
1
−
P
)
n
−
k
,
k
=
0
,
1
,
⋯
,
n
P\{x=k\}=C_n^k P^k(1-P)^{n-k}, k=0,1, \cdots, n
P{x=k}=CnkPk(1−P)n−k,k=0,1,⋯,n
⟹
X
∼
B
(
n
,
P
)
\Longrightarrow X \sim B(n, P)
⟹X∼B(n,P)
3. 几何分布: 几何分布 与几何无关, 首中即停止, 记
X
X
X 为试验次数
⟹
P
{
x
=
k
}
=
P
1
(
1
−
P
)
k
−
1
,
k
=
1
,
2
,
⋯
\Longrightarrow P\{x=k\}=P^1(1-P)^{k-1}, k=1,2, \cdots
⟹P{x=k}=P1(1−P)k−1,k=1,2,⋯
4. 超几何分布: 超几何分布 古典概型, 设 N N N 件产品, M M M 、件正品, N − M N-M N−M 件次品, 无放回取 n n n 次, 则 P { x = k } = C M k C N − M n − k C N n P\{x=k\}=\frac{C_M^k C_{N-M}^{n-k}}{C_N^n} P{x=k}=CNnCMkCN−Mn−k
5. 泊松分布: 某时间段内, 某场合下, 源源不断的质点来流的个数, 也常用于描述稀有事件的
P
P
P
P
{
X
=
k
}
=
λ
k
k
!
e
−
λ
,
{
λ
−
−
强度
k
=
0
,
1
,
⋯
P\{X=k\}=\frac{\lambda^k}{k !} e^{-\lambda},\left\{\begin{array}{l} \lambda-- \text { 强度 } \\ k=0,1, \cdots \end{array}\right.
P{X=k}=k!λke−λ,{λ−− 强度 k=0,1,⋯
6. 均匀分布: 对比几何概型, 若
X
∼
f
(
x
)
=
{
1
b
−
a
,
a
≤
x
≤
b
0
,
其他
X \sim f(x)=\left\{\begin{array}{l}\frac{1}{b-a}, a \leq x \leq b \\ 0, \text { 其他 }\end{array}\right.
X∼f(x)={b−a1,a≤x≤b0, 其他 , 称
X
∼
U
[
a
,
b
]
X \sim U[a, b]
X∼U[a,b],
[注]高档次说法: “ X X X 在 I I I 上的任意子区间取值的概率与该子区间长度成正比” → X ∼ U ( I ) \rightarrow X \sim U(I) →X∼U(I)
7.指数分布 :
X
∼
f
(
x
)
=
{
λ
e
−
λ
x
,
x
>
0
0
,
x
≤
0
X \sim f(x)=\left\{\begin{array}{l}\lambda e^{-\lambda x}, x>0 \\ 0, x \leq 0\end{array}\right.
X∼f(x)={λe−λx,x>00,x≤0, 称
X
∼
E
(
λ
)
,
λ
−
X \sim E(\lambda), \lambda-
X∼E(λ),λ−-失效率
[注]:无记忆性:
P
{
X
≥
t
+
s
∣
X
≥
t
}
=
P
{
x
≥
s
}
P\{X \geq t+s \mid X \geq t\}=P\{x \geq s\}
P{X≥t+s∣X≥t}=P{x≥s}
F
(
x
)
=
P
{
X
≤
x
}
=
∫
−
∞
x
f
(
t
)
d
t
=
{
1
−
e
−
λ
x
,
x
≥
0
0
,
x
<
0
F(x)=P\{X \leq x\}=\int_{-\infty}^x f(t) d t=\left\{\begin{array}{l} 1-e^{-\lambda x}, x \geq 0 \\ 0, x<0 \end{array}\right.
F(x)=P{X≤x}=∫−∞xf(t)dt={1−e−λx,x≥00,x<0
{
几何分布, 离散性等待分布
指数分布, 连续性等待分布
\left\{\begin{array}{l}\text { 几何分布, 离散性等待分布 } \\ \text { 指数分布, 连续性等待分布 }\end{array}\right.
{ 几何分布, 离散性等待分布 指数分布, 连续性等待分布
8. 正态分布:
X
∼
f
(
x
)
=
1
2
π
σ
e
−
(
x
−
μ
)
2
2
σ
2
,
−
∞
<
x
<
+
∞
X \sim f(x)=\frac{1}{\sqrt{2 \pi} \sigma} e^{-\frac{(x-\mu)^2}{2 \sigma^2}},-\infty<x<+\infty
X∼f(x)=2πσ1e−2σ2(x−μ)2,−∞<x<+∞
[注]:
若
μ
=
0
,
σ
2
=
1
⟹
X
∼
N
(
0
,
1
)
若\mu=0, \sigma^2=1 \Longrightarrow X \sim N(0,1)
若μ=0,σ2=1⟹X∼N(0,1)
X
∼
φ
(
x
)
=
1
2
π
e
−
x
2
2
X
∼
Φ
(
x
)
=
∫
−
∞
x
1
2
π
e
−
t
2
2
d
t
\begin{aligned} & X \sim \varphi(x)=\frac{1}{\sqrt{2 \pi}} e^{-\frac{x^2}{2}} \\ & X \sim \Phi(x)=\int_{-\infty}^x \frac{1}{\sqrt{2 \pi}} e^{-\frac{t^2}{2}} d t \end{aligned}
X∼φ(x)=2π1e−2x2X∼Φ(x)=∫−∞x2π1e−2t2dt
分布名称 记号 期望 方差 矩估计 极大似然估 计 0-1分布 B ( 1 , p ) p p q p ^ M = X ˉ p ^ L = X ˉ 泊松分布 P o i s ( λ ) λ λ λ ^ M = X ˉ λ ^ L = X ˉ 几何分布 G e o ( p ) 1 / p q / p 2 p ^ M = 1 / X ˉ p ^ L = 1 / X ˉ 均匀分布 U [ a , b ] ( a + b ) / 2 ( b − a ) 2 / 12 a ^ M = X ˉ − 3 S n a ^ L = X ( 1 ) b ^ M = X ˉ + 3 S n b ^ L = X ( n ) 指数分布 E x p ( λ ) 1 / λ 1 / λ 2 λ ^ M = 1 / X ˉ λ ^ L = 1 / X ˉ 正态分布 N ( μ , σ 2 ) μ σ 2 μ ^ M = X ˉ μ ^ L = X ˉ σ ^ M 2 = S n 2 σ ^ L 2 = S n 2 \begin{equation} \begin{array}{llllll} \hline \text { 分布名称 } & \text { 记号 } & \text { 期望 } & \text { 方差 } & \text { 矩估计 } & \begin{array}{l} \text { 极大似然估 } \\ \text { 计 } \end{array} \\ \hline \text { 0-1分布 } & B(1, p) & p & p q & \hat{p}_M=\bar{X} & \hat{p}_L=\bar{X} \\ \hline \text { 泊松分布 } & P o i s(\lambda) & \lambda & \lambda & \hat{\lambda}_M=\bar{X} & \hat{\lambda}_L=\bar{X} \\ \hline \text { 几何分布 } & G e o(p) & 1 / p & q / p^2 & \hat{p}_M=1 / \bar{X} & \hat{p}_L=1 / \bar{X} \\ \hline \text { 均匀分布 } & \mathbb{U}[a, b] & (a+b) / 2 & (b-a)^2 / 12 & \hat{a}_M=\bar{X}-\sqrt{3} S_n & \hat{a}_L=X_{(1)} \\ \hline & & & \hat{b}_M=\bar{X}+\sqrt{3} S_n & \hat{b}_L=X_{(n)} \\ \hline \text { 指数分布 } & E x p(\lambda) & 1 / \lambda & 1 / \lambda^2 & \hat{\lambda}_M=1 / \bar{X} & \hat{\lambda}_L=1 / \bar{X} \\ \hline \text { 正态分布 } & N\left(\mu, \sigma^2\right) & \mu & \sigma^2 & \hat{\mu}_M=\bar{X} & \hat{\mu}_L=\bar{X} \\ \hline & & & & \hat{\sigma}_M^2=S_n^2 & \hat{\sigma}_L^2=S_n^2 \end{array} \end{equation} 分布名称 0-1分布 泊松分布 几何分布 均匀分布 指数分布 正态分布 记号 B(1,p)Pois(λ)Geo(p)U[a,b]Exp(λ)N(μ,σ2) 期望 pλ1/p(a+b)/21/λμ 方差 pqλq/p2(b−a)2/12b^M=Xˉ+3Sn1/λ2σ2 矩估计 p^M=Xˉλ^M=Xˉp^M=1/Xˉa^M=Xˉ−3Snb^L=X(n)λ^M=1/Xˉμ^M=Xˉσ^M2=Sn2 极大似然估 计 p^L=Xˉλ^L=Xˉp^L=1/Xˉa^L=X(1)λ^L=1/Xˉμ^L=Xˉσ^L2=Sn2
1.2 一维随机变量及其分布
1.2.1 随机变量及其分布函数
1.随机变量: 设 E E E是随机试验, Ω \Omega Ω是其样本空间,如果对于每一个样本点 ω ∈ Ω \omega \in \Omega ω∈Ω,都有一个确定的实数 X ( ω ) X(\omega) X(ω)与之对应,则称样本空间上的实质函数 X ( ω ) X(\omega) X(ω)为随机变量,简记 X X X。
2.随机变量的分布函数: 设 X X X是一个随机变量, x x x是任意实数,称 F ( x ) = P { X ≤ x } , − ∞ < x < ∞ F(x)=P\{X \le x\},-\infty <x<\infty F(x)=P{X≤x},−∞<x<∞为 X X X的分布函数。
性质:1) F ( x ) F(x) F(x)单调不减;
2) 0 ≤ F ( x ) ≤ 1 , 且 F ( − ∞ ) = lim x → − ∞ F ( x ) = 0 , F ( ∞ ) = lim x → ∞ F ( x ) = 1 0 \le F(x) \le1,且F(-\infty)=\lim\limits_{x \to -\infty}F(x)=0,F(\infty)=\lim\limits_{x \to \infty}F(x)=1 0≤F(x)≤1,且F(−∞)=x→−∞limF(x)=0,F(∞)=x→∞limF(x)=1;
3) F ( x ) F(x) F(x)为右连续,即 F ( x 0 + 0 ) = lim x → x 0 + 0 F ( x ) = F ( x 0 ) F(x_{0}+0)=\lim\limits_{x \to x_{0}+0}F(x)=F(x_{0}) F(x0+0)=x→x0+0limF(x)=F(x0)。
公式:1) P { a < x ≤ b } = P { x ≤ b } − P { x ≤ a } = F ( b ) − F ( a ) P\{a<x \le b\}=P\{x \le b\}-P\{x \le a\}=F(b)-F(a) P{a<x≤b}=P{x≤b}−P{x≤a}=F(b)−F(a);
2) P { x > b } = 1 − P { x ≤ b } = 1 − F ( b ) P\{x>b\}=1-P\{x \le b\}=1-F(b) P{x>b}=1−P{x≤b}=1−F(b);
3) P { x ≥ b } = 1 − P { x < b } = 1 − F ( b − 0 ) P\{x \ge b\}=1-P\{x < b\}=1-F(b-0) P{x≥b}=1−P{x<b}=1−F(b−0).
若 x ∈ D x \in D x∈D为一随机事件,则其概率为 P ( x ∈ D ) = ∫ D f ( x ) d x P(x \in D)=\int_{D}{f(x)dx} P(x∈D)=∫Df(x)dx.
1.2.2 离散型随机变量及其分布
离散型随机变量: 全部可能取到的值有限或无限可列,这种随机变量称为离散型随机变量。
离散型随机变量的分布律: 设离散型随机变量 X X X所有可能的取值为 x i ( i = 1 , 2 , . . . ) x_{i}(i=1,2,...) xi(i=1,2,...), X X X取各个可能值得概率,即事件 { X = x i } \{X=x_{i}\} {X=xi}的概率为 P { X = x i } = p i , i = 1 , 2 , . . . P\{X=x_{i}\}=p_{i},i=1,2,... P{X=xi}=pi,i=1,2,...;称 P { X = x i } = p i , i = 1 , 2 , . . . P\{X=x_{i}\}=p_{i},i=1,2,... P{X=xi}=pi,i=1,2,...为离散型随机变量 X X X的分布律,分布律可用矩阵或表格表示。
X X X | x 1 x_{1} x1 | x 2 x_{2} x2 | … | x n x_{n} xn | … |
---|---|---|---|---|---|
P i P_{i} Pi | p 1 p_{1} p1 | p 2 p_{2} p2 | … | p n p_{n} pn | … |
离散型随机变量的分布函数: 设 X X X是一个随机变量, x x x是任意实数,函数 F ( x ) = P { X ≤ x } = P { ω ∣ X ( ω ) ≤ x } , − ∞ < x < ∞ F(x)=P\{X \le x\}=P\{\omega | X(\omega) \le x\},-\infty <x<\infty F(x)=P{X≤x}=P{ω∣X(ω)≤x},−∞<x<∞称为 X X X的分布函数。
**性质:**1)归一性: ∑ i = 1 n p i = 1 \sum_{i=1}^{n}{p_{i}}=1 ∑i=1npi=1;
2)非负性: p i ≥ 0 , i = 1 , 2 , . . . p_{i} \ge 0,i=1,2,... pi≥0,i=1,2,...;
3)一点区间: P { x = a } = F ( a ) − F ( a − 0 ) P\{x=a\}=F(a)-F(a-0) P{x=a}=F(a)−F(a−0), P { x ∈ B } = ∑ x i ∈ B p i P\{x \in B\}=\displaystyle\sum_{x_{i} \in B}{p_{i}} P{x∈B}=xi∈B∑pi。
1.2.3 连续型随机变量及其分布
连续型随机变量: 连续不可分的随机变量称为连续型随机变量;
连续型随机变量的概率密度函数: 设 F ( x ) F(x) F(x)是连续随机变量 X X X的分布函数,若存在非负函数 f ( x ) f(x) f(x),对任意实数 x x x,有 F ( x ) = ∫ − ∞ x f ( x ) d x F(x)=\int_{-\infty}^{x}{f(x)dx} F(x)=∫−∞xf(x)dx,则称 f ( x ) f(x) f(x)为 X X X的概率密度函数(概率密度函数为分布函数的导数)。
连续型随机变量的分布函数: F ( x ) = ∫ − ∞ x f ( x ) d x , − ∞ < x < ∞ F(x)=\int_{-\infty}^{x}{f(x)dx},-\infty<x<\infty F(x)=∫−∞xf(x)dx,−∞<x<∞。
**性质:**1)归一性: ∫ − ∞ ∞ f ( x ) d x = 1 \int_{-\infty}^{\infty}{f(x)dx}=1 ∫−∞∞f(x)dx=1;
2)非负性: f ( x ) ≥ 0 f(x) \ge 0 f(x)≥0;
3)一点区间: P { x = a } = F ( a ) − F ( a − 0 ) P\{x=a\}=F(a)-F(a-0) P{x=a}=F(a)−F(a−0), P { x ∈ B } = ∫ B f ( x ) d x P\{x \in B\}=\int_{B}{f(x)dx} P{x∈B}=∫Bf(x)dx。
1.2.4 随机变量函数的分布
1. 离散型到离散型:
设
X
X
X为离散型随机变量,其概率分布为
p
i
=
P
{
X
=
x
i
}
(
i
=
1
,
2
,
.
.
.
)
p_{i}=P\{X=x_{i}\}(i=1,2,...)
pi=P{X=xi}(i=1,2,...),则
X
X
X的函数
Y
=
g
(
X
)
Y=g(X)
Y=g(X)也是离散型随机变量,其概率分布为
P
{
Y
=
g
(
x
i
)
}
(
i
=
1
,
2
,
.
.
.
)
P\{Y=g(x_{i})\}(i=1,2,...)
P{Y=g(xi)}(i=1,2,...),即
B
∼
(
g
(
x
1
)
g
(
x
2
)
.
.
.
p
1
p
2
.
.
.
)
B \sim \begin{pmatrix} g(x_{1}) & g(x_{2}) & ...\\ p_{1} & p_{2} & ... \end{pmatrix}
B∼(g(x1)p1g(x2)p2......)
如果有若干个
g
(
x
i
)
g(x_{i})
g(xi)值相同,则合并诸项为一项
g
(
x
k
)
g(x_{k})
g(xk),并讲相应概率相加作为
Y
Y
Y取
g
(
x
k
)
g(x_{k})
g(xk)值的概率。
2. 连续型到连续型(混合型):
设
X
X
X为离散型随机变量,其分布函数、概率密度分别为
F
X
(
x
)
F_{X}(x)
FX(x)与
f
X
(
x
)
f_{X}(x)
fX(x),随机变量
Y
=
g
(
X
)
Y=g(X)
Y=g(X)是
X
X
X的函数,则
Y
Y
Y的分布函数和概率密度可用分布函数法求得.
F
Y
(
y
)
=
P
{
Y
≤
y
}
=
P
{
g
(
X
)
≤
y
}
=
∫
g
(
X
)
≤
y
f
X
(
x
)
d
x
\begin{aligned} F_{Y}(y) = P\{Y \le y\}=P\{g(X) \le y\}=\int_{g(X) \le y}{f_{X}(x)dx} \end{aligned}
FY(y)=P{Y≤y}=P{g(X)≤y}=∫g(X)≤yfX(x)dx
如果
F
Y
(
y
)
F_{Y}(y)
FY(y)连续,且除有限个点外,
F
Y
′
(
y
)
F^{\prime}_{Y}(y)
FY′(y)存在且连续,则
Y
Y
Y的概率密度
f
Y
(
y
)
=
F
Y
′
(
y
)
f_{Y}(y)=F^{\prime}_{Y}(y)
fY(y)=FY′(y)。
1.3 多元随机变量及其分布
1.3.1 联合分布函数及密度函数
联合分布函数: 对任意
n
n
n个实数
x
1
,
x
2
,
.
.
.
,
x
n
x_{1},x_{2},...,x_{n}
x1,x2,...,xn,称
n
n
n元函数
F
(
x
1
,
x
2
,
.
.
.
,
x
n
)
=
P
{
X
1
≤
x
1
,
X
2
≤
x
2
,
.
.
.
,
X
n
≤
x
n
}
\begin{aligned} F(x_{1},x_{2},...,x_{n})=P\{X_{1} \le x_{1},X_{2} \le x_{2},...,X_{n} \le x_{n}\} \end{aligned}
F(x1,x2,...,xn)=P{X1≤x1,X2≤x2,...,Xn≤xn}
为
n
n
n维随机变量
(
X
1
,
X
2
,
.
.
.
,
X
n
)
(X_{1},X_{2},...,X_{n})
(X1,X2,...,Xn)的联合分布函数。
特别的,当
n
=
2
n=2
n=2时,则对任意的实数
x
,
y
x,y
x,y,称二元函数
F
(
x
,
y
)
=
P
{
X
≤
x
,
Y
≤
y
}
\begin{aligned} F(x,y)=P\{X \le x,Y \le y\} \end{aligned}
F(x,y)=P{X≤x,Y≤y}
为二维随机变量
(
X
,
Y
)
(X,Y)
(X,Y)的联合分布函数,简称分布函数,记为
(
X
,
Y
)
∼
F
(
x
,
y
)
(X,Y) \sim F(x,y)
(X,Y)∼F(x,y)。
性质:
1)单调性:
F
(
x
,
y
)
F(x,y)
F(x,y)是
x
,
y
x,y
x,y的单调不减函数:
对任意固定的 y y y,当 x 1 < x 2 x_{1}<x_{2} x1<x2时, F ( x 1 , y ) ≤ F ( x 2 , y ) F(x_{1},y) \le F(x_{2},y) F(x1,y)≤F(x2,y);
对任意固定的 x x x,当 y 1 < y 2 y_{1}<y_{2} y1<y2时, F ( x , y 1 ) ≤ F ( x , y 2 ) F(x,y_{1}) \le F(x,y_{2}) F(x,y1)≤F(x,y2);
2)右连续: F ( x , y ) F(x,y) F(x,y)是 x , y x,y x,y的右连续函数:
lim x → x + F ( x , y ) = F ( x 0 + 0 , y ) = F ( x 0 , y ) \lim\limits_{x \to x^{+}}{F(x,y)}=F(x_{0}+0,y)=F(x_{0},y) x→x+limF(x,y)=F(x0+0,y)=F(x0,y);
lim y → y + F ( x , y ) = F ( x , y 0 + 0 ) = F ( x , y 0 ) \lim\limits_{y \to y^{+}}{F(x,y)}=F(x,y_{0}+0)=F(x,y_{0}) y→y+limF(x,y)=F(x,y0+0)=F(x,y0)
3)有界性: F ( − ∞ , y ) = F ( x , − ∞ ) = F ( − ∞ , − ∞ ) = 0 , F ( + ∞ , + ∞ ) = 1 F(-\infty,y)=F(x,-\infty)=F(-\infty,-\infty)=0,F(+\infty,+\infty)=1 F(−∞,y)=F(x,−∞)=F(−∞,−∞)=0,F(+∞,+∞)=1
4)非负性:对任意 x 1 < x 2 , y 1 < y 2 x_{1}<x_{2},y_{1}<y_{2} x1<x2,y1<y2,有
P { x 1 < X ≤ x 2 , y 1 < Y < y 2 } = F ( x 2 , y 2 ) − F ( x 2 , y 1 ) − F ( x 1 , y 2 ) + F ( x 1 , y 1 ) ≥ 0 P\{x_{1} <X \le x_{2},y_{1}< Y< y_{2}\}=F(x_{2},y_{2})-F(x_{2},y_{1})-F(x_{1},y_{2})+F(x_{1},y_{1}) \ge 0 P{x1<X≤x2,y1<Y<y2}=F(x2,y2)−F(x2,y1)−F(x1,y2)+F(x1,y1)≥0
1.3.2 边缘分布函数
边缘分布函数: 设二维随机变量
(
X
,
Y
)
(X,Y)
(X,Y)的联合分布函数为
F
(
x
,
y
)
F(x,y)
F(x,y),随机变量
X
X
X和
Y
Y
Y的分布函数
F
X
(
x
)
F_{X}(x)
FX(x)和
F
Y
(
y
)
F_{Y}(y)
FY(y)分别称为
(
X
,
Y
)
(X,Y)
(X,Y)关于
X
X
X和关于
Y
Y
Y的边缘分布函数,由概率性质得
F
X
(
x
)
=
P
{
X
≤
x
}
=
P
{
X
≤
x
,
Y
<
+
∞
}
=
lim
y
→
+
∞
P
{
X
≤
x
,
Y
≤
y
}
=
lim
y
→
+
∞
F
(
x
,
y
)
=
F
(
x
,
+
∞
)
.
同理,有
F
Y
(
y
)
=
F
(
+
∞
,
y
)
.
\begin{aligned} F_{X}(x)=P\{X \le x\}=P\{X \le x,Y < +\infty\}\\ = \lim\limits_{y \to +\infty}{P\{X \le x,Y \le y\}}\\ =\lim\limits_{y \to +\infty}{F( x,y)}=F(x,+\infty).\\ 同理,有F_{Y}(y)=F(+\infty,y). \end{aligned}
FX(x)=P{X≤x}=P{X≤x,Y<+∞}=y→+∞limP{X≤x,Y≤y}=y→+∞limF(x,y)=F(x,+∞).同理,有FY(y)=F(+∞,y).
1.3.3 条件分布函数
条件分布函数: 设二维随机变量
(
X
,
Y
)
(X,Y)
(X,Y)的概率密度函数为
f
(
x
,
y
)
f(x,y)
f(x,y),
(
X
,
Y
)
(X,Y)
(X,Y)关于
Y
Y
Y的边缘概率密度为
f
Y
(
y
)
f_{Y}(y)
fY(y),若对固定的
y
y
y,
f
Y
(
y
)
>
0
f_{Y}(y)>0
fY(y)>0,则称
f
(
x
,
y
)
f
Y
(
y
)
\frac{f(x,y)}{f_{Y}(y)}
fY(y)f(x,y)为在
Y
=
y
Y=y
Y=y的条件下
X
X
X的条件概率密度,记为
f
X
∣
Y
(
x
∣
y
)
=
f
(
x
,
y
)
f
Y
(
y
)
\begin{aligned} f_{X|Y}(x|y)=\frac{f(x,y)}{f_{Y}(y)} \end{aligned}
fX∣Y(x∣y)=fY(y)f(x,y)
称
∫
−
∞
x
f
X
∣
Y
(
x
∣
y
)
d
x
=
∫
−
∞
x
f
(
x
,
y
)
f
Y
(
y
)
d
x
\int_{-\infty}^{x}{f_{X|Y}(x|y)dx}=\int_{-\infty}^{x}{\frac{f(x,y)}{f_{Y}(y)}dx}
∫−∞xfX∣Y(x∣y)dx=∫−∞xfY(y)f(x,y)dx为在
Y
=
y
Y=y
Y=y的条件下
X
X
X的条件分布函数,记为
P
{
X
≤
x
∣
Y
=
y
}
P\{X \le x|Y=y\}
P{X≤x∣Y=y}或
F
X
∣
Y
(
x
∣
y
)
F_{X|Y}(x|y)
FX∣Y(x∣y),即
F
X
∣
Y
(
x
∣
y
)
=
P
{
X
≤
x
∣
Y
=
y
}
=
∫
−
∞
x
f
(
x
,
y
)
f
Y
(
y
)
d
x
\begin{aligned} F_{X|Y}(x|y)=P\{X \le x | Y = y\}=\int_{-\infty}^{x}{\frac{f(x,y)}{f_{Y}(y)}dx} \end{aligned}
FX∣Y(x∣y)=P{X≤x∣Y=y}=∫−∞xfY(y)f(x,y)dx
同理,可以定义
f
Y
∣
X
(
y
∣
x
)
=
f
(
x
,
y
)
f
X
(
x
)
f_{Y|X}(y|x)=\frac{f(x,y)}{f_{X}(x)}
fY∣X(y∣x)=fX(x)f(x,y)和
F
Y
∣
X
(
y
∣
x
)
=
∫
−
∞
y
f
(
x
,
y
)
f
X
(
x
)
d
y
F_{Y|X}(y|x)=\int_{-\infty}^{y}{\frac{f(x,y)}{f_{X}(x)}dy}
FY∣X(y∣x)=∫−∞yfX(x)f(x,y)dy。
1.3.4 二维随机变量
1.离散型:
(
X
,
Y
)
∼
P
i
j
(X, Y) \sim P_{i j}
(X,Y)∼Pij (联合分布律
)
)
)
条件分布为
P
(
X
=
x
i
∣
Y
=
y
i
)
=
P
(
X
=
x
i
,
Y
=
y
j
)
P
(
Y
=
y
j
)
=
P
i
j
P
⋅
j
P\left(X=x_i \mid Y=y_i\right)=\frac{P\left(X=x_i, Y=y_j\right)}{P\left(Y=y_j\right)}=\frac{P_{i j}}{P_{\cdot j}}
P(X=xi∣Y=yi)=P(Y=yj)P(X=xi,Y=yj)=P⋅jPij
P
(
X
=
1
∣
Y
=
0
)
=
P
21
P
⋅
1
条件
=
联合
边缘
P(X=1 \mid Y=0)=\frac{P_{21}}{P_{\cdot 1}}\\ \text{条件}=\frac{\text { 联合 }}{\text { 边缘 }}
P(X=1∣Y=0)=P⋅1P21条件= 边缘 联合
-
连续型: ( X , Y ) ∼ f ( x , y ) (X, Y) \sim f(x, y) (X,Y)∼f(x,y) (联合概率密度)
边缘分布函数 F X ( x ) = F ( x , + ∞ ) = ∫ − ∞ x [ ∫ − ∞ + ∞ f ( u , v ) d v ] d u F_{X}(x)=F(x,+\infty)=\int_{-\infty}^{x}[\int_{-\infty}^{+\infty}{f(u,v)dv}]du FX(x)=F(x,+∞)=∫−∞x[∫−∞+∞f(u,v)dv]du,边缘密度 f X ( x ) = ∫ − ∞ + ∞ f ( x , y ) d y , f Y ( y ) = ∫ − ∞ + ∞ f ( x , y ) d x f_X(x)=\int_{-\infty}^{+\infty} f(x, y) d y, f_Y(y)=\int_{-\infty}^{+\infty} f(x, y) d x fX(x)=∫−∞+∞f(x,y)dy,fY(y)=∫−∞+∞f(x,y)dx
联合分布函数 F ( x , y ) = P { X ≤ x , Y ≤ y } = ∫ − ∞ y ∫ − ∞ x f ( u , v ) d u d v F(x,y)=P\{X \le x,Y \le y\}=\int_{-\infty}^{y}\int_{-\infty}^{x}{f(u,v)dudv} F(x,y)=P{X≤x,Y≤y}=∫−∞y∫−∞xf(u,v)dudv,且联合密度 f ( x , y ) = ∂ 2 F ( x , y ) ∂ x ∂ y f(x,y)=\frac{\partial^{2}F(x,y)}{\partial x \partial y} f(x,y)=∂x∂y∂2F(x,y)
条件分布函数
F
X
∣
Y
=
∫
−
∞
x
f
X
∣
Y
(
x
∣
y
)
d
x
=
∫
−
∞
x
f
(
x
,
y
)
f
Y
(
y
)
d
x
F_{X|Y}=\int_{-\infty}^{x}{f_{X|Y}(x|y)dx}=\int_{-\infty}^{x}{\frac{f(x, y)}{f_Y(y)}dx}
FX∣Y=∫−∞xfX∣Y(x∣y)dx=∫−∞xfY(y)f(x,y)dx,条件密度
f
X
∣
Y
(
x
∣
y
)
=
f
(
x
,
y
)
f
Y
(
y
)
f_{X \mid Y}(x \mid y)=\frac{f(x, y)}{f_Y(y)}
fX∣Y(x∣y)=fY(y)f(x,y)
无论离散还是连续,
条件
=
联合
边缘
\text{条件}=\frac{\text { 联合 }}{\text { 边缘 }}
条件= 边缘 联合
- 独立性: 设 ( X , Y ) , X , Y (X, Y), X, Y (X,Y),X,Y 独立 ⟺ F ( x , y ) = F X ( x ) ⋅ F Y ( y ) \Longleftrightarrow F(x, y)=F_X(x) \cdot F_Y(y) ⟺F(x,y)=FX(x)⋅FY(y)
⟺ P i j = P i ⋅ ⋅ P ⋅ j , ∀ i , j ⟺ f ( x , y ) = f X ( x ) ⋅ f Y ( y ) \begin{aligned} & \Longleftrightarrow P_{i j}=P_{i \cdot} \cdot P_{\cdot j}, \forall i, j \\ & \Longleftrightarrow f(x, y)=f_X(x) \cdot f_Y(y) \end{aligned} ⟺Pij=Pi⋅⋅P⋅j,∀i,j⟺f(x,y)=fX(x)⋅fY(y)
-
两个分布
(1)均匀分布 ( X , Y ) ∼ f ( x , y ) = { 1 S D , ( x , y ) ∈ D 0 , ( x , y ) ∉ D (X, Y) \sim f(x, y)=\left\{\begin{array}{l}\frac{1}{S_D},(x, y) \in D \\ 0,(x, y) \notin D\end{array}\right. (X,Y)∼f(x,y)={SD1,(x,y)∈D0,(x,y)∈/D
(2)正态分布 ( X , Y ) ∼ N ( μ 1 , μ 2 , σ 1 2 , σ 2 2 , ρ ) (X, Y) \sim N\left(\mu_1, \mu_2, \sigma_1^2, \sigma_2^2, \rho\right) (X,Y)∼N(μ1,μ2,σ12,σ22,ρ)
其中 E ( X ) = μ 1 , E ( Y ) = μ 2 , D ( X ) = σ 1 2 , D ( Y ) = σ 2 2 , e x y = ρ E (X)=\mu_1, E (Y)=\mu_2, D (X)=\sigma_1^2, D (Y)=\sigma_2^2, e_{x y}=\rho E(X)=μ1,E(Y)=μ2,D(X)=σ12,D(Y)=σ22,exy=ρ。
[注]:求谁不积谁,不积分先定限,限内画条线,先交写下限,后交写上限。
1.4 数字特征
1.4.1 一维随机变量的数字特征
1.数学期望:
1)一维随机变量的数学期望: E ( X ) { X ∼ P i ⟹ E ( X ) = ∑ i x i P i X ∼ f ( x ) ⟹ E ( X ) = ∫ − ∞ + ∞ f ( x ) d x E (X)\left\{\begin{array}{l}X \sim P_i \Longrightarrow E (X)=\sum_i x_i P_i \\ X \sim f(x) \Longrightarrow E (X)=\int_{-\infty}^{+\infty} f(x) d x\end{array}\right. E(X){X∼Pi⟹E(X)=∑ixiPiX∼f(x)⟹E(X)=∫−∞+∞f(x)dx;
2)一维随机变量函数的数学期望: E ( Y ) { X ∼ p i , Y = g ( X ) ⟹ E ( Y ) = ∑ i g ( x i ) p i X ∼ f ( x ) , Y = g ( X ) ⟹ E ( Y ) = ∫ − ∞ + ∞ g ( x ) f ( x ) d x E (Y)\left\{\begin{array}{l} X \sim p_i, Y=g(X) \Longrightarrow E (Y)=\sum_i g\left(x_i\right) p_i \\X \sim f(x), Y=g(X) \Longrightarrow E (Y)=\int_{-\infty}^{+\infty} g(x) f(x) d x \end{array}\right. E(Y){X∼pi,Y=g(X)⟹E(Y)=∑ig(xi)piX∼f(x),Y=g(X)⟹E(Y)=∫−∞+∞g(x)f(x)dx。
2.方差、标准差:
D
(
X
)
=
E
[
(
X
−
E
(
X
)
)
2
]
\begin{aligned} D (X)=E\left[(X-E (X))^2\right] \end{aligned}
D(X)=E[(X−E(X))2]
1)定义法:
{
X
∼
p
i
⟹
D
(
X
)
=
E
[
(
X
−
E
(
X
)
)
2
]
=
∑
i
(
x
i
−
E
(
X
)
)
2
p
i
X
∼
f
(
x
)
⟹
D
(
X
)
=
E
[
(
X
−
E
(
X
)
)
2
]
=
∫
−
∞
+
∞
(
x
−
E
(
X
)
)
2
f
(
x
)
d
x
\left\{\begin{array}{l}X \sim p_i \Longrightarrow D (X)=E\left[(X-E (X))^2\right]=\sum_i\left(x_i-E (X)\right)^2 p_i \\ X \sim f(x) \Longrightarrow D (X)=E\left[(X-E (X))^2\right]=\int_{-\infty}^{+\infty}(x-E (X))^2 f(x) d x\end{array}\right.
{X∼pi⟹D(X)=E[(X−E(X))2]=∑i(xi−E(X))2piX∼f(x)⟹D(X)=E[(X−E(X))2]=∫−∞+∞(x−E(X))2f(x)dx
2)公式法: D ( X ) = E [ ( X − E ( X ) ) 2 ] = E [ X 2 − 2 ⋅ X ⋅ E X + ( E ( X ) ) 2 ] = E ( X 2 ) − 2 ⋅ E ( X ) ⋅ E ( X ) + ( E X ) 2 ] \left.D (X)=E\left[(X-E (X))^2\right]=E\left[X^2-2 \cdot X \cdot E X+(E (X))^2\right]=E\left(X^2\right)-2 \cdot E (X) \cdot E (X)+(E X)^2\right] D(X)=E[(X−E(X))2]=E[X2−2⋅X⋅EX+(E(X))2]=E(X2)−2⋅E(X)⋅E(X)+(EX)2] ,即 D X = E ( X 2 ) − ( E X ) 2 D X=E\left(X^2\right)-(E X)^2 DX=E(X2)−(EX)2。
3.性质:
(1)
E
a
=
a
,
E
(
E
(
X
)
=
E
(
X
)
E a=a, E(E (X)=E (X)
Ea=a,E(E(X)=E(X)
(2)
E
(
a
X
+
b
Y
)
=
a
E
(
X
)
+
b
E
(
Y
)
,
E
(
∑
i
=
1
n
a
i
X
i
)
=
∑
i
=
1
n
a
i
E
(
X
i
)
E(a X+b Y)=a E (X)+b E (Y), E\left(\sum_{i=1}^n a_i X_i\right)=\sum_{i=1}^n a_i E (X_i)
E(aX+bY)=aE(X)+bE(Y),E(∑i=1naiXi)=∑i=1naiE(Xi) (无条件)
(3) 若
X
,
Y
X, Y
X,Y 相互独立, 则
E
(
X
Y
)
=
E
(
X
)
E
(
Y
)
E(X Y)=E (X) E (Y)
E(XY)=E(X)E(Y)
(4)
D
a
=
0
,
D
(
E
(
X
)
=
0
,
D
(
D
(
X
)
=
0
D a=0, D(E (X)=0, D(D (X)=0
Da=0,D(E(X)=0,D(D(X)=0
(5) 若
X
,
Y
X, Y
X,Y 相互独立, 则
D
(
X
±
Y
)
=
D
X
+
D
Y
D(X \pm Y)=D X+D Y
D(X±Y)=DX+DY
(6)
D
(
a
X
+
b
)
=
a
2
D
X
,
E
(
a
X
+
b
)
=
a
E
X
+
b
D(a X+b)=a^2 D X, E(a X+b)=a E X+b
D(aX+b)=a2DX,E(aX+b)=aEX+b
(7)一般,
D
(
X
±
Y
)
=
D
(
X
)
+
D
(
Y
)
±
2
Cov
(
X
,
Y
)
D(X \pm Y)=D (X)+D (Y) \pm 2 \operatorname{Cov}(X, Y)
D(X±Y)=D(X)+D(Y)±2Cov(X,Y)
D
(
∑
i
=
1
n
X
i
)
=
∑
i
=
1
n
D
X
i
+
2
∑
1
≤
i
<
j
≤
n
Cov
(
x
i
,
x
j
)
D\left(\sum_{i=1}^n X_i\right)=\sum_{i=1}^n D X_i+2 \sum_{1 \leq i<j \leq n} \operatorname{Cov}\left(x_i, x_j\right)
D(i=1∑nXi)=i=1∑nDXi+21≤i<j≤n∑Cov(xi,xj)
[注] 1.
0
−
1
0-1
0−1 分布,
E
X
=
p
,
D
X
=
p
−
p
2
=
(
1
−
p
)
p
,
X
∼
(
1
0
p
1
−
p
)
E X=p, D X=p-p^2=(1-p) p, X \sim\left(\begin{array}{cc}1 & 0 \\ p & 1-p\end{array}\right)
EX=p,DX=p−p2=(1−p)p,X∼(1p01−p)
- X ∼ B ( n , p ) , E X = n p , D X = n p ( 1 − p ) X \sim B(n, p), E X=n p, D X=n p(1-p) X∼B(n,p),EX=np,DX=np(1−p)
- X ∼ P ( λ ) , E X = λ , D X = λ X \sim P(\lambda), E X=\lambda, D X=\lambda X∼P(λ),EX=λ,DX=λ
- X ∼ G e ( p ) , E X = 1 p , D X = 1 − p p 2 X \sim G e(p), E X=\frac{1}{p}, D X=\frac{1-p}{p^2} X∼Ge(p),EX=p1,DX=p21−p
- X ∼ U [ a , b ] , E X = a + b 2 , D X = ( b − a ) 2 12 X \sim U[a, b], E X=\frac{a+b}{2}, D X=\frac{(b-a)^2}{12} X∼U[a,b],EX=2a+b,DX=12(b−a)2
- X ∼ E X ( λ ) , E X = 1 λ , D X = 1 λ 2 X \sim E_X(\lambda), E X=\frac{1}{\lambda}, D X=\frac{1}{\lambda^2} X∼EX(λ),EX=λ1,DX=λ21
- X ∼ N ( μ , σ 2 ) , E X = μ , D X = σ 2 X \sim N\left(\mu, \sigma^2\right), E X=\mu, D X=\sigma^2 X∼N(μ,σ2),EX=μ,DX=σ2
- X ∼ χ 2 ( n ) , E X = n , D X = 2 n X \sim \chi^2(n), E X=n, D X=2 n X∼χ2(n),EX=n,DX=2n。
1.4.2 二维随机变量的数字特征
1.数学期望:
1)离散型: ( X , Y ) ∼ p i j , Z = g ( X , Y ) ⟹ E Z = ∑ i ∑ j g ( x i , y i ) p i j (X, Y) \sim p_{i j}, Z=g(X, Y) \Longrightarrow E Z=\sum_i \sum_j g\left(x_i, y_i\right) p_{i j} (X,Y)∼pij,Z=g(X,Y)⟹EZ=∑i∑jg(xi,yi)pij;
2)连续型: ( X , Y ) ∼ f ( x , y ) , Z = g ( X , Y ) ⟹ E Z = ∫ − ∞ + ∞ ∫ − ∞ + ∞ g ( x , y ) f ( x , y ) d x d y (X, Y) \sim f(x, y), Z=g(X, Y) \Longrightarrow E Z=\int_{-\infty}^{+\infty} \int_{-\infty}^{+\infty} g(x, y) f(x, y) d x d y (X,Y)∼f(x,y),Z=g(X,Y)⟹EZ=∫−∞+∞∫−∞+∞g(x,y)f(x,y)dxdy
2.协方差和相关系数:
Cov ( X , Y ) = E [ X − E ( X ) ) ( Y − E ( Y ) ) ] , Cov ( X , X ) = E [ ( X − E ( X ) ) ( X − E ( X ) ) ] = E [ ( X − E X ) 2 ] = D ( X ) \operatorname{Cov}(X, Y)=E[X-E (X))(Y-E (Y))], \operatorname{Cov}(X, X)=E[(X-E (X))(X-E (X))]=E\left[(X-E X)^2\right]=D (X) Cov(X,Y)=E[X−E(X))(Y−E(Y))],Cov(X,X)=E[(X−E(X))(X−E(X))]=E[(X−EX)2]=D(X)
- 定义法:
{ ( X , Y ) ∼ p i j ⟹ Cov ( X , Y ) = ∑ i ∑ j ( x i − E ( X ) ) ( u i − E ( Y ) ) p i j ( X , Y ) ∼ f ( x , y ) ⟹ Cov ( X , Y ) = ∫ − ∞ + ∞ ∫ − ∞ + ∞ ( x − E ( X ) ) ( y − E ( Y ) ) f ( x , y ) d x d y \left\{\begin{array}{l} (X, Y) \sim p_{i j} \Longrightarrow \operatorname{Cov}(X, Y)=\sum_i \sum_j\left(x_i-E (X)\right)\left(u_i-E (Y)\right) p_{i j} \\ (X, Y) \sim f(x, y) \Longrightarrow \operatorname{Cov}(X, Y)=\int_{-\infty}^{+\infty} \int_{-\infty}^{+\infty}(x-E (X))(y-E (Y)) f(x, y) d x d y \end{array}\right. {(X,Y)∼pij⟹Cov(X,Y)=∑i∑j(xi−E(X))(ui−E(Y))pij(X,Y)∼f(x,y)⟹Cov(X,Y)=∫−∞+∞∫−∞+∞(x−E(X))(y−E(Y))f(x,y)dxdy
- 公式法:
Cov ( X , Y ) = E ( X Y − X ⋅ E ( Y ) − E ( X ) ⋅ Y + E ( X ) ⋅ E ( Y ) ) = E ( X Y ) − E ( X ) ⋅ E ( Y ) − E ( X ) ⋅ E ( Y ) + E ( X ) ⋅ E ( Y ) = E ( X Y ) − E ( X ) E ( Y ) \begin{aligned} & \operatorname{Cov}(X, Y)=E(X Y-X \cdot E (Y)-E (X) \cdot Y+E (X) \cdot E (Y)) \\ & =E(X Y)-E (X) \cdot E (Y)-E (X) \cdot E (Y)+E (X) \cdot E (Y)=E(X Y)-E (X) E (Y) \end{aligned} Cov(X,Y)=E(XY−X⋅E(Y)−E(X)⋅Y+E(X)⋅E(Y))=E(XY)−E(X)⋅E(Y)−E(X)⋅E(Y)+E(X)⋅E(Y)=E(XY)−E(X)E(Y)
3. ρ X Y = Cov ( X , Y ) D X D Y { = 0 ⟺ X , Y 不相关 ≠ 0 ⟺ X , Y 相关 \text { 3. } \rho_{X Y}=\frac{\operatorname{Cov}(X, Y)}{\sqrt{D X} \sqrt{D Y}}\left\{\begin{array}{l} =0 \Longleftrightarrow X, Y \text { 不相关 } \\ \neq 0 \Longleftrightarrow X, Y \text { 相关 } \end{array}\right. 3. ρXY=DXDYCov(X,Y){=0⟺X,Y 不相关 =0⟺X,Y 相关
3.性质:
-
Cov ( X , Y ) = Cov ( Y , X ) \operatorname{Cov}(X, Y)=\operatorname{Cov}(Y, X) Cov(X,Y)=Cov(Y,X)
-
Cov ( a X , b Y ) = a b Cov ( X , Y ) \operatorname{Cov}(a X, b Y)=a b \operatorname{Cov}(X, Y) Cov(aX,bY)=abCov(X,Y)
-
Cov ( X 1 + X 2 , Y ) = Cov ( X 1 , Y ) + Cov ( X 2 , Y ) \operatorname{Cov}\left(X_1+X_2, Y\right)=\operatorname{Cov}\left(X_1, Y\right)+\operatorname{Cov}\left(X_2, Y\right) Cov(X1+X2,Y)=Cov(X1,Y)+Cov(X2,Y)
-
∣ ρ X Y ∣ ≤ 1 \left|\rho_{X Y}\right| \leq 1 ∣ρXY∣≤1
5. ρ X Y = 1 ⟺ P { Y = a X + b } = 1 ( a > 0 ) , ρ X Y = − 1 ⟺ P { Y = a X + b } = 1 ( a < 0 ) \text { 5. } \rho_{X Y}=1 \Longleftrightarrow P\{Y=a X+b\}=1(a>0), \rho_{X Y}=-1 \Longleftrightarrow P\{Y=a X+b\}=1(a<0) 5. ρXY=1⟺P{Y=aX+b}=1(a>0),ρXY=−1⟺P{Y=aX+b}=1(a<0)
考试时:
Y
=
a
X
+
b
,
a
>
0
⟹
ρ
X
Y
=
1
,
Y
=
a
X
+
b
,
a
<
0
⟹
ρ
X
Y
=
−
1
Y=a X+b, a>0 \Longrightarrow \rho_{X Y}=1, Y=a X+b, a<0 \Longrightarrow \rho_{X Y}=-1
Y=aX+b,a>0⟹ρXY=1,Y=aX+b,a<0⟹ρXY=−1
小结:五个充要条件
ρ
X
Y
=
0
⟺
{
Cov
(
X
,
Y
)
=
0
E
(
X
Y
)
=
E
(
X
)
⋅
E
(
Y
)
D
(
X
+
Y
)
=
D
(
X
)
+
D
(
Y
)
D
(
X
−
Y
)
=
D
(
X
)
+
D
(
Y
)
\begin{aligned} & \rho_{X Y}=0 \Longleftrightarrow\left\{\begin{array}{l} \operatorname{Cov}(X, Y)=0 \\ E(X Y)=E (X) \cdot E (Y) \\ D(X+Y)=D (X)+D (Y) \\ D(X-Y)=D (X)+D (Y) \end{array}\right. \\ \end{aligned}
ρXY=0⟺⎩
⎨
⎧Cov(X,Y)=0E(XY)=E(X)⋅E(Y)D(X+Y)=D(X)+D(Y)D(X−Y)=D(X)+D(Y)
1.4.3 独立性和相关性的判定
X , Y 独立 ⟹ ρ X Y = 0 若 ( X , Y ) ∼ N ( μ , σ 2 ) , 则 X , Y 独立 ⟺ X , Y 不相关 ( ρ X Y = 0 ) \begin{aligned} & X, Y \text { 独立 } \Longrightarrow \rho_{X Y}=0 \\ & \text { 若 }(X, Y) \sim N\left(\mu, \sigma^2\right), \text { 则 } X, Y \text { 独立 } \Longleftrightarrow X, Y \text { 不相关 }\left(\rho_{X Y}=0\right) \end{aligned} X,Y 独立 ⟹ρXY=0 若 (X,Y)∼N(μ,σ2), 则 X,Y 独立 ⟺X,Y 不相关 (ρXY=0)