概率论基础

1.概率论

1.1 随机事件与概率

1.1.1 基本概念

样本点(sample point): 称为试验 S S S的可能结果为样本点,用 ω \omega ω表示。

样本空间(sample space):称试验 S S S的样本点构成的集合为样本空间,用 Ω \Omega Ω表示。于是
Ω = { ω ∣ ω 是试验 S 的样本点 } \begin{aligned} \Omega = \{\omega|\omega是试验S的样本点\} \end {aligned} Ω={ωω是试验S的样本点}

事件(event): Ω \Omega Ω是试验 S S S的样本空间。当 Ω \Omega Ω中只有有限个样本点时,称 Ω \Omega Ω的子集为事件。当试验的样本点(试验结果) ω \omega ω落在 A A A中,称事件 A A A发生,否则称 A A A不发生。

​ 按照上述约定,子集符号 A ⊂ Ω A \subset \Omega AΩ表示 A A A是事件。通常用大写字母 A , B , C , D A,B,C,D A,B,C,D等表示事件。

​ 用 A ‾ = Ω − A \overline{A}=\Omega-A A=ΩA表示集合 A A A余集。则事件 A A A发生和样本点 ω ∈ A \omega \in A ωA是等价的,事件 A A A不发生和样本点 ω ∈ A ‾ \omega \in \overline{A} ωA是等价的。

​ 空集 ∅ \emptyset Ω \Omega Ω的子集,由于 ∅ \emptyset 中没有样本点,永远不会发生,所以称 ∅ \emptyset 不可能事件 Ω \Omega Ω也是样本空间 Ω \Omega Ω的子集,包含了所有的样本点,因而总会发生。我们称 Ω \Omega Ω必然事件

基本事件: 由一个样本点组成的子集。

1.1.2 事件间的关系和运算

1. 事件关系

事件关系概念表示
事件包含 A A A发生则 B B B必发生 A ⊂ B A \subset B AB,特别的, A ⊂ B A \subset B AB B ⊂ A B \subset A BA,则 A = B A=B A=B
事件的并 A A A B B B至少有一个发生 A ∪ B A \cup B AB
事件的交 A A A B B B同时发生 A ∩ B A \cap B AB A B AB AB
事件的差 A A A发生而 B B B不发生 A − B A - B AB
互斥事件 A A A B B B不能同时发生 A ∩ B = ∅ A \cap B=\emptyset AB= A B = ∅ AB=\emptyset AB=
对立事件 A A A B B B必有一个发生,且仅有一个, A A A的对立事件 A ‾ \overline{A} A A A ‾ = ∅ A\overline{A}=\emptyset AA= A ∪ A ‾ = Ω A \cup \overline{A}=\Omega AA=Ω

2. 运算规律

​ 交换律: A ∪ B = B ∪ A A \cup B=B \cup A AB=BA A ∩ B = B ∩ A A \cap B=B \cap A AB=BA

​ 结合律: ( A ∪ B ) ∪ C = A ∪ ( B ∪ C ) (A \cup B) \cup C=A \cup (B \cup C) (AB)C=A(BC) ( A ∩ B ) ∩ C = A ∩ ( B ∩ C ) (A \cap B) \cap C=A \cap (B \cap C) (AB)C=A(BC)

​ 分配律: A ∩ ( B ∪ C ) = ( A ∩ B ) ∪ ( A ∩ C ) A \cap (B \cup C)=(A \cap B)\cup(A \cap C) A(BC)=(AB)(AC), A ∪ ( B ∩ C ) = ( A ∪ B ) ∩ ( A ∪ C ) A \cup (B \cap C)=(A \cup B)\cap(A \cup C) A(BC)=(AB)(AC) A ( B − C ) = A B − A C A(B-C)=AB-AC A(BC)=ABAC

​ 吸收律:若 A ⊂ B A \subset B AB,则 A B = A , A ∪ B = B AB=A,A \cup B=B AB=A,AB=B

​ 德摩根律: A ∪ B ‾ = A ‾ ∩ B ‾ \overline{A \cup B}=\overline{A} \cap \overline{B} AB=AB, A ∩ B ‾ = A ‾ ∪ B ‾ \overline{A \cap B}=\overline{A} \cup \overline{B} AB=AB

​ 减法公式: A − B = A − A B = A B ‾ A-B=A-AB=A \overline{B} AB=AAB=AB

1.1.3 概率

频率: 相同条件下,进行 n n n次试验,事件 A A A发生的次数 k k k和试验总次数的比 k / n k/n k/n称为频率。频率是个有限次概念

概率: E E E是随机试验, S S S是他的样本空间,对于 E E E的每一事件 A A A赋予一个实数,记为 P ( A ) P(A) P(A),称为事件 A A A的频率

频率的性质:

​ 非负性: 0 ≤ P ( A ) ≤ 1 0 \le P(A) \le 1 0P(A)1

​ 规范性: P ( Ω ) = 1 , P ( ∅ ) = 0 P(\Omega)=1,P(\emptyset)=0 P(Ω)=1,P()=0

​ 可加可列性: A 1 , A 2 , . . . , A n A_{1},A_{2},...,A_{n} A1,A2,...,An两两互不相容(即 A i A j = ∅ A_{i}A_{j}=\emptyset AiAj=),有 P ( A 1 A 2 . . . A n ) = P ( A 1 ) + P ( A 2 ) + . . . + P ( A n ) P(A_{1}A_{2}...A_{n})=P(A_{1})+P(A_{2})+...+P(A_{n}) P(A1A2...An)=P(A1)+P(A2)+...+P(An)

1.1.4古典概型(等可能概型)

条件: 1)有限个样本点;2)等可能性
P ( A ) = A 所包含的样本点数 样本总数 = A n n \begin{aligned} P(A)=\frac{A所包含的样本点数}{样本总数}=\frac{A_{n}}{n} \end{aligned} P(A)=样本总数A所包含的样本点数=nAn

1.1.5 几何概型

条件: 1)无限样本点;2)等可能性
p ( A ) = μ A μ Ω , μ 表示几何大小的度量。 \begin{aligned} p(A)=\frac{\mu_{A}}{\mu_{\Omega}},\mu表示几何大小的度量。 \end{aligned} p(A)=μΩμA,μ表示几何大小的度量。

1.1.6 条件概率

P ( B ∣ A ) P(B|A) P(BA)表示在事件 A A A发生的条件下,事件 B B B发生的概率。
P ( B ∣ A ) = P ( A B ) P ( A ) ⇒ P ( A B ) = P ( A ) P ( B ∣ A ) \begin{aligned} P(B|A)=\frac{P(AB)}{P(A)} \Rightarrow P(AB)=P(A)P(B|A) \end{aligned} P(BA)=P(A)P(AB)P(AB)=P(A)P(BA)
​ 一些公式:
P ( B ∪ C ∣ A ) = P ( B ∣ A ) + P ( C ∣ A ) − P ( B C ∣ A ) 当 B ∩ C = ∅ 时, P ( B ∪ C ∣ A ) = P ( B ∣ A ) + P ( C ∣ A ) \begin{aligned} P(B \cup C|A)=P(B|A)+P(C|A)-P(BC|A)\\ 当B \cap C=\emptyset时,P(B \cup C|A)=P(B|A)+P(C|A) \end{aligned} P(BCA)=P(BA)+P(CA)P(BCA)BC=时,P(BCA)=P(BA)+P(CA)

P ( B − C ∣ A ) = P ( B ∣ A ) − P ( B C ∣ A ) \begin{aligned} P(B-C|A)=P(B|A)-P(BC|A) \end{aligned} P(BCA)=P(BA)P(BCA)

P ( B ‾ ∣ A ) = 1 − P ( B ∣ A ) \begin{aligned} P(\overline{B}|A)=1-P(B|A) \end{aligned} P(BA)=1P(BA)

1.1.7 重要公式

1. 五大公式:

​ 加法公式: P ( A ∪ B ) = P ( A ) + P ( B ) − P ( A B ) P(A \cup B)=P(A)+P(B)-P(A B) P(AB)=P(A)+P(B)P(AB)

​ 减法公式: P ( A − B ) = P ( A ) − P ( A B ) P(A-B)=P(A)-P(A B) P(AB)=P(A)P(AB)

​ 乘法公式: P ( A B ) = P ( A ) P ( B ∣ A ) P(A B)=P(A) P(B \mid A) P(AB)=P(A)P(BA), P ( A B C ) = P ( C ∣ A B ) P ( B ∣ A ) P ( A ) P(ABC)=P(C|AB)P(B|A)P(A) P(ABC)=P(CAB)P(BA)P(A),

P ( A 1 A 2 ⋯ A n ) = P ( A 1 ) P ( A 2 ∣ A 1 ) ⋯ P ( A n ∣ A 1 A 2 ⋯ A n − 1 ) P\left(A_1 A_2 \cdots A_n\right)=P\left(A_1\right) P\left(A_2 \mid A_1\right) \cdots P\left(A_n \mid A_1 A_2 \cdots A_{n-1}\right) P(A1A2An)=P(A1)P(A2A1)P(AnA1A2An1)

​ 全概率公式: P ( B ) = ∑ i = 1 n P ( A i ) P ( B ∣ A i ) P(B)=\sum_{i=1}^n P\left(A_i\right) P\left(B \mid A_i\right) P(B)=i=1nP(Ai)P(BAi)

​ 贝叶斯公式: P ( A i ∣ B ) = P ( A i B ) P ( B ) = P ( A i ) P ( B ∣ A i ) ∑ i = 1 n P ( A i ) P ( B ∣ A i ) P\left(A_i \mid B\right)=\frac{P\left(A_i B\right)}{P(B)}=\frac{P\left(A_i\right) P\left(B \mid A_i\right)}{\sum_{i=1}^n P\left(A_i\right) P\left(B \mid A_i\right)} P(AiB)=P(B)P(AiB)=i=1nP(Ai)P(BAi)P(Ai)P(BAi)

A1
B
A2
A3
...
An

2. 独立: P ( A B ) = P ( A ) P ( B ) P(A B)=P(A) P(B) P(AB)=P(A)P(B)

3. 排列组合:

​ 排列 A n r = n ( n − 1 ) ⋯ ( n − r + 1 ) A_n^r=n(n-1) \cdots(n-r+1) Anr=n(n1)(nr+1)
​ 从 n n n 个不同的元素中任取 r r r 个, 按一定顺序排成一列组合 C n r = n ! ( n − r ) ! r ! = A n r r ! C_n^r=\frac{n !}{(n-r) ! r !}=\frac{A_n^r}{r !} Cnr=(nr)!r!n!=r!Anr
​ 从 n n n 个不同的元素中任取 r r r 个, 不计顺序排成一组

4. 伯努利试验: P ( X = k ) = C N K p k ( 1 − p ) n − k P(X=k)=C_N^K p^k(1-p)^{n-k} P(X=k)=CNKpk(1p)nk

1.1.8 常见分布

1. 0-1分布: X ∼ ( 1 0 P 1 − P ) \quad X \sim\left(\begin{array}{cc}1 & 0 \\ P & 1-P\end{array}\right) X(1P01P)

2. 二项分布:

​ 二项分布 { 1.  独立  2. P ( A ) = P 3.  只有  A , A ˉ ,  非白即黑  \left\{\begin{array}{l}1 . \text { 独立 } \\ 2 . P(A)=P \\ 3 . \text { 只有 } A, \bar{A}, \text { 非白即黑 }\end{array}\right. 1. 独立 2.P(A)=P3. 只有 A,Aˉ, 非白即黑 
​ 记 X X X A A A 发生的次数, P { x = k } = C n k P k ( 1 − P ) n − k , k = 0 , 1 , ⋯   , n P\{x=k\}=C_n^k P^k(1-P)^{n-k}, k=0,1, \cdots, n P{x=k}=CnkPk(1P)nk,k=0,1,,n
⟹ X ∼ B ( n , P ) \Longrightarrow X \sim B(n, P) XB(n,P)
3. 几何分布: 几何分布 与几何无关, 首中即停止, 记 X X X 为试验次数 ⟹ P { x = k } = P 1 ( 1 − P ) k − 1 , k = 1 , 2 , ⋯ \Longrightarrow P\{x=k\}=P^1(1-P)^{k-1}, k=1,2, \cdots P{x=k}=P1(1P)k1,k=1,2,

4. 超几何分布: 超几何分布 古典概型, 设 N N N 件产品, M M M 、件正品, N − M N-M NM 件次品, 无放回取 n n n 次, 则 P { x = k } = C M k C N − M n − k C N n P\{x=k\}=\frac{C_M^k C_{N-M}^{n-k}}{C_N^n} P{x=k}=CNnCMkCNMnk

5. 泊松分布: 某时间段内, 某场合下, 源源不断的质点来流的个数, 也常用于描述稀有事件的 P P P
P { X = k } = λ k k ! e − λ , { λ − −  强度  k = 0 , 1 , ⋯ P\{X=k\}=\frac{\lambda^k}{k !} e^{-\lambda},\left\{\begin{array}{l} \lambda-- \text { 强度 } \\ k=0,1, \cdots \end{array}\right. P{X=k}=k!λkeλ,{λ 强度 k=0,1,
6. 均匀分布: 对比几何概型, 若 X ∼ f ( x ) = { 1 b − a , a ≤ x ≤ b 0 ,  其他  X \sim f(x)=\left\{\begin{array}{l}\frac{1}{b-a}, a \leq x \leq b \\ 0, \text { 其他 }\end{array}\right. Xf(x)={ba1,axb0, 其他 , 称 X ∼ U [ a , b ] X \sim U[a, b] XU[a,b],

​ [注]高档次说法: “ X X X I I I 上的任意子区间取值的概率与该子区间长度成正比” → X ∼ U ( I ) \rightarrow X \sim U(I) XU(I)

7.指数分布 : X ∼ f ( x ) = { λ e − λ x , x > 0 0 , x ≤ 0 X \sim f(x)=\left\{\begin{array}{l}\lambda e^{-\lambda x}, x>0 \\ 0, x \leq 0\end{array}\right. Xf(x)={λeλx,x>00,x0, 称 X ∼ E ( λ ) , λ − X \sim E(\lambda), \lambda- XE(λ),λ-失效率
[注]:无记忆性: P { X ≥ t + s ∣ X ≥ t } = P { x ≥ s } P\{X \geq t+s \mid X \geq t\}=P\{x \geq s\} P{Xt+sXt}=P{xs}
F ( x ) = P { X ≤ x } = ∫ − ∞ x f ( t ) d t = { 1 − e − λ x , x ≥ 0 0 , x < 0 F(x)=P\{X \leq x\}=\int_{-\infty}^x f(t) d t=\left\{\begin{array}{l} 1-e^{-\lambda x}, x \geq 0 \\ 0, x<0 \end{array}\right. F(x)=P{Xx}=xf(t)dt={1eλx,x00,x<0
{  几何分布, 离散性等待分布   指数分布, 连续性等待分布  \left\{\begin{array}{l}\text { 几何分布, 离散性等待分布 } \\ \text { 指数分布, 连续性等待分布 }\end{array}\right. { 几何分布离散性等待分布  指数分布连续性等待分布 
8. 正态分布: X ∼ f ( x ) = 1 2 π σ e − ( x − μ ) 2 2 σ 2 , − ∞ < x < + ∞ X \sim f(x)=\frac{1}{\sqrt{2 \pi} \sigma} e^{-\frac{(x-\mu)^2}{2 \sigma^2}},-\infty<x<+\infty Xf(x)=2π σ1e2σ2(xμ)2,<x<+

​ [注]: 若 μ = 0 , σ 2 = 1 ⟹ X ∼ N ( 0 , 1 ) 若\mu=0, \sigma^2=1 \Longrightarrow X \sim N(0,1) μ=0,σ2=1XN(0,1)
X ∼ φ ( x ) = 1 2 π e − x 2 2 X ∼ Φ ( x ) = ∫ − ∞ x 1 2 π e − t 2 2 d t \begin{aligned} & X \sim \varphi(x)=\frac{1}{\sqrt{2 \pi}} e^{-\frac{x^2}{2}} \\ & X \sim \Phi(x)=\int_{-\infty}^x \frac{1}{\sqrt{2 \pi}} e^{-\frac{t^2}{2}} d t \end{aligned} Xφ(x)=2π 1e2x2XΦ(x)=x2π 1e2t2dt

 分布名称   记号   期望   方差   矩估计   极大似然估   计   0-1分布  B ( 1 , p ) p p q p ^ M = X ˉ p ^ L = X ˉ  泊松分布  P o i s ( λ ) λ λ λ ^ M = X ˉ λ ^ L = X ˉ  几何分布  G e o ( p ) 1 / p q / p 2 p ^ M = 1 / X ˉ p ^ L = 1 / X ˉ  均匀分布  U [ a , b ] ( a + b ) / 2 ( b − a ) 2 / 12 a ^ M = X ˉ − 3 S n a ^ L = X ( 1 ) b ^ M = X ˉ + 3 S n b ^ L = X ( n )  指数分布  E x p ( λ ) 1 / λ 1 / λ 2 λ ^ M = 1 / X ˉ λ ^ L = 1 / X ˉ  正态分布  N ( μ , σ 2 ) μ σ 2 μ ^ M = X ˉ μ ^ L = X ˉ σ ^ M 2 = S n 2 σ ^ L 2 = S n 2 \begin{equation} \begin{array}{llllll} \hline \text { 分布名称 } & \text { 记号 } & \text { 期望 } & \text { 方差 } & \text { 矩估计 } & \begin{array}{l} \text { 极大似然估 } \\ \text { 计 } \end{array} \\ \hline \text { 0-1分布 } & B(1, p) & p & p q & \hat{p}_M=\bar{X} & \hat{p}_L=\bar{X} \\ \hline \text { 泊松分布 } & P o i s(\lambda) & \lambda & \lambda & \hat{\lambda}_M=\bar{X} & \hat{\lambda}_L=\bar{X} \\ \hline \text { 几何分布 } & G e o(p) & 1 / p & q / p^2 & \hat{p}_M=1 / \bar{X} & \hat{p}_L=1 / \bar{X} \\ \hline \text { 均匀分布 } & \mathbb{U}[a, b] & (a+b) / 2 & (b-a)^2 / 12 & \hat{a}_M=\bar{X}-\sqrt{3} S_n & \hat{a}_L=X_{(1)} \\ \hline & & & \hat{b}_M=\bar{X}+\sqrt{3} S_n & \hat{b}_L=X_{(n)} \\ \hline \text { 指数分布 } & E x p(\lambda) & 1 / \lambda & 1 / \lambda^2 & \hat{\lambda}_M=1 / \bar{X} & \hat{\lambda}_L=1 / \bar{X} \\ \hline \text { 正态分布 } & N\left(\mu, \sigma^2\right) & \mu & \sigma^2 & \hat{\mu}_M=\bar{X} & \hat{\mu}_L=\bar{X} \\ \hline & & & & \hat{\sigma}_M^2=S_n^2 & \hat{\sigma}_L^2=S_n^2 \end{array} \end{equation}  分布名称  0-1分布  泊松分布  几何分布  均匀分布  指数分布  正态分布  记号 B(1,p)Pois(λ)Geo(p)U[a,b]Exp(λ)N(μ,σ2) 期望 pλ1/p(a+b)/21/λμ 方差 pqλq/p2(ba)2/12b^M=Xˉ+3 Sn1/λ2σ2 矩估计 p^M=Xˉλ^M=Xˉp^M=1/Xˉa^M=Xˉ3 Snb^L=X(n)λ^M=1/Xˉμ^M=Xˉσ^M2=Sn2 极大似然估   p^L=Xˉλ^L=Xˉp^L=1/Xˉa^L=X(1)λ^L=1/Xˉμ^L=Xˉσ^L2=Sn2

1.2 一维随机变量及其分布

1.2.1 随机变量及其分布函数

1.随机变量: E E E是随机试验, Ω \Omega Ω是其样本空间,如果对于每一个样本点 ω ∈ Ω \omega \in \Omega ωΩ,都有一个确定的实数 X ( ω ) X(\omega) X(ω)与之对应,则称样本空间上的实质函数 X ( ω ) X(\omega) X(ω)为随机变量,简记 X X X

2.随机变量的分布函数: X X X是一个随机变量, x x x是任意实数,称 F ( x ) = P { X ≤ x } , − ∞ < x < ∞ F(x)=P\{X \le x\},-\infty <x<\infty F(x)=P{Xx},<x< X X X的分布函数。

​ 性质:1) F ( x ) F(x) F(x)单调不减;

​ 2) 0 ≤ F ( x ) ≤ 1 , 且 F ( − ∞ ) = lim ⁡ x → − ∞ F ( x ) = 0 , F ( ∞ ) = lim ⁡ x → ∞ F ( x ) = 1 0 \le F(x) \le1,且F(-\infty)=\lim\limits_{x \to -\infty}F(x)=0,F(\infty)=\lim\limits_{x \to \infty}F(x)=1 0F(x)1,F()=xlimF(x)=0,F()=xlimF(x)=1

​ 3) F ( x ) F(x) F(x)为右连续,即 F ( x 0 + 0 ) = lim ⁡ x → x 0 + 0 F ( x ) = F ( x 0 ) F(x_{0}+0)=\lim\limits_{x \to x_{0}+0}F(x)=F(x_{0}) F(x0+0)=xx0+0limF(x)=F(x0)

​ 公式:1) P { a < x ≤ b } = P { x ≤ b } − P { x ≤ a } = F ( b ) − F ( a ) P\{a<x \le b\}=P\{x \le b\}-P\{x \le a\}=F(b)-F(a) P{a<xb}=P{xb}P{xa}=F(b)F(a);

​ 2) P { x > b } = 1 − P { x ≤ b } = 1 − F ( b ) P\{x>b\}=1-P\{x \le b\}=1-F(b) P{x>b}=1P{xb}=1F(b)

​ 3) P { x ≥ b } = 1 − P { x < b } = 1 − F ( b − 0 ) P\{x \ge b\}=1-P\{x < b\}=1-F(b-0) P{xb}=1P{x<b}=1F(b0).

x ∈ D x \in D xD为一随机事件,则其概率为 P ( x ∈ D ) = ∫ D f ( x ) d x P(x \in D)=\int_{D}{f(x)dx} P(xD)=Df(x)dx.

1.2.2 离散型随机变量及其分布

离散型随机变量: 全部可能取到的值有限或无限可列,这种随机变量称为离散型随机变量。

离散型随机变量的分布律: 设离散型随机变量 X X X所有可能的取值为 x i ( i = 1 , 2 , . . . ) x_{i}(i=1,2,...) xi(i=1,2,...), X X X取各个可能值得概率,即事件 { X = x i } \{X=x_{i}\} {X=xi}的概率为 P { X = x i } = p i , i = 1 , 2 , . . . P\{X=x_{i}\}=p_{i},i=1,2,... P{X=xi}=pi,i=1,2,...;称 P { X = x i } = p i , i = 1 , 2 , . . . P\{X=x_{i}\}=p_{i},i=1,2,... P{X=xi}=pi,i=1,2,...为离散型随机变量 X X X的分布律,分布律可用矩阵或表格表示。

X X X x 1 x_{1} x1 x 2 x_{2} x2 x n x_{n} xn
P i P_{i} Pi p 1 p_{1} p1 p 2 p_{2} p2 p n p_{n} pn

离散型随机变量的分布函数: X X X是一个随机变量, x x x是任意实数,函数 F ( x ) = P { X ≤ x } = P { ω ∣ X ( ω ) ≤ x } , − ∞ < x < ∞ F(x)=P\{X \le x\}=P\{\omega | X(\omega) \le x\},-\infty <x<\infty F(x)=P{Xx}=P{ωX(ω)x}<x<称为 X X X的分布函数。

**性质:**1)归一性: ∑ i = 1 n p i = 1 \sum_{i=1}^{n}{p_{i}}=1 i=1npi=1;

​ 2)非负性: p i ≥ 0 , i = 1 , 2 , . . . p_{i} \ge 0,i=1,2,... pi0,i=1,2,...;

​ 3)一点区间: P { x = a } = F ( a ) − F ( a − 0 ) P\{x=a\}=F(a)-F(a-0) P{x=a}=F(a)F(a0), P { x ∈ B } = ∑ x i ∈ B p i P\{x \in B\}=\displaystyle\sum_{x_{i} \in B}{p_{i}} P{xB}=xiBpi

1.2.3 连续型随机变量及其分布

连续型随机变量: 连续不可分的随机变量称为连续型随机变量;

连续型随机变量的概率密度函数: F ( x ) F(x) F(x)是连续随机变量 X X X的分布函数,若存在非负函数 f ( x ) f(x) f(x),对任意实数 x x x,有 F ( x ) = ∫ − ∞ x f ( x ) d x F(x)=\int_{-\infty}^{x}{f(x)dx} F(x)=xf(x)dx,则称 f ( x ) f(x) f(x) X X X的概率密度函数(概率密度函数为分布函数的导数)。

连续型随机变量的分布函数: F ( x ) = ∫ − ∞ x f ( x ) d x , − ∞ < x < ∞ F(x)=\int_{-\infty}^{x}{f(x)dx},-\infty<x<\infty F(x)=xf(x)dx,<x<

**性质:**1)归一性: ∫ − ∞ ∞ f ( x ) d x = 1 \int_{-\infty}^{\infty}{f(x)dx}=1 f(x)dx=1;

​ 2)非负性: f ( x ) ≥ 0 f(x) \ge 0 f(x)0;

​ 3)一点区间: P { x = a } = F ( a ) − F ( a − 0 ) P\{x=a\}=F(a)-F(a-0) P{x=a}=F(a)F(a0), P { x ∈ B } = ∫ B f ( x ) d x P\{x \in B\}=\int_{B}{f(x)dx} P{xB}=Bf(x)dx

1.2.4 随机变量函数的分布

1. 离散型到离散型:

X X X为离散型随机变量,其概率分布为 p i = P { X = x i } ( i = 1 , 2 , . . . ) p_{i}=P\{X=x_{i}\}(i=1,2,...) pi=P{X=xi}(i=1,2,...),则 X X X的函数 Y = g ( X ) Y=g(X) Y=g(X)也是离散型随机变量,其概率分布为 P { Y = g ( x i ) } ( i = 1 , 2 , . . . ) P\{Y=g(x_{i})\}(i=1,2,...) P{Y=g(xi)}(i=1,2,...),即
B ∼ ( g ( x 1 ) g ( x 2 ) . . . p 1 p 2 . . . ) B \sim \begin{pmatrix} g(x_{1}) & g(x_{2}) & ...\\ p_{1} & p_{2} & ... \end{pmatrix} B(g(x1)p1g(x2)p2......)
如果有若干个 g ( x i ) g(x_{i}) g(xi)值相同,则合并诸项为一项 g ( x k ) g(x_{k}) g(xk),并讲相应概率相加作为 Y Y Y g ( x k ) g(x_{k}) g(xk)值的概率。

2. 连续型到连续型(混合型):

X X X为离散型随机变量,其分布函数、概率密度分别为 F X ( x ) F_{X}(x) FX(x) f X ( x ) f_{X}(x) fX(x),随机变量 Y = g ( X ) Y=g(X) Y=g(X) X X X的函数,则 Y Y Y的分布函数和概率密度可用分布函数法求得.
F Y ( y ) = P { Y ≤ y } = P { g ( X ) ≤ y } = ∫ g ( X ) ≤ y f X ( x ) d x \begin{aligned} F_{Y}(y) = P\{Y \le y\}=P\{g(X) \le y\}=\int_{g(X) \le y}{f_{X}(x)dx} \end{aligned} FY(y)=P{Yy}=P{g(X)y}=g(X)yfX(x)dx
如果 F Y ( y ) F_{Y}(y) FY(y)连续,且除有限个点外, F Y ′ ( y ) F^{\prime}_{Y}(y) FY(y)存在且连续,则 Y Y Y的概率密度 f Y ( y ) = F Y ′ ( y ) f_{Y}(y)=F^{\prime}_{Y}(y) fY(y)=FY(y)

1.3 多元随机变量及其分布

1.3.1 联合分布函数及密度函数

联合分布函数: 对任意 n n n个实数 x 1 , x 2 , . . . , x n x_{1},x_{2},...,x_{n} x1,x2,...,xn,称 n n n元函数
F ( x 1 , x 2 , . . . , x n ) = P { X 1 ≤ x 1 , X 2 ≤ x 2 , . . . , X n ≤ x n } \begin{aligned} F(x_{1},x_{2},...,x_{n})=P\{X_{1} \le x_{1},X_{2} \le x_{2},...,X_{n} \le x_{n}\} \end{aligned} F(x1,x2,...,xn)=P{X1x1,X2x2,...,Xnxn}
n n n维随机变量 ( X 1 , X 2 , . . . , X n ) (X_{1},X_{2},...,X_{n}) (X1,X2,...,Xn)的联合分布函数。

特别的,当 n = 2 n=2 n=2时,则对任意的实数 x , y x,y x,y,称二元函数
F ( x , y ) = P { X ≤ x , Y ≤ y } \begin{aligned} F(x,y)=P\{X \le x,Y \le y\} \end{aligned} F(x,y)=P{Xx,Yy}
为二维随机变量 ( X , Y ) (X,Y) (X,Y)的联合分布函数,简称分布函数,记为 ( X , Y ) ∼ F ( x , y ) (X,Y) \sim F(x,y) (X,Y)F(x,y)

性质:
1)单调性: F ( x , y ) F(x,y) F(x,y) x , y x,y x,y的单调不减函数:

​ 对任意固定的 y y y,当 x 1 < x 2 x_{1}<x_{2} x1<x2时, F ( x 1 , y ) ≤ F ( x 2 , y ) F(x_{1},y) \le F(x_{2},y) F(x1,y)F(x2,y);

​ 对任意固定的 x x x,当 y 1 < y 2 y_{1}<y_{2} y1<y2时, F ( x , y 1 ) ≤ F ( x , y 2 ) F(x,y_{1}) \le F(x,y_{2}) F(x,y1)F(x,y2);

​ 2)右连续: F ( x , y ) F(x,y) F(x,y) x , y x,y x,y的右连续函数:

lim ⁡ x → x + F ( x , y ) = F ( x 0 + 0 , y ) = F ( x 0 , y ) \lim\limits_{x \to x^{+}}{F(x,y)}=F(x_{0}+0,y)=F(x_{0},y) xx+limF(x,y)=F(x0+0,y)=F(x0,y);

lim ⁡ y → y + F ( x , y ) = F ( x , y 0 + 0 ) = F ( x , y 0 ) \lim\limits_{y \to y^{+}}{F(x,y)}=F(x,y_{0}+0)=F(x,y_{0}) yy+limF(x,y)=F(x,y0+0)=F(x,y0)

​ 3)有界性: F ( − ∞ , y ) = F ( x , − ∞ ) = F ( − ∞ , − ∞ ) = 0 , F ( + ∞ , + ∞ ) = 1 F(-\infty,y)=F(x,-\infty)=F(-\infty,-\infty)=0,F(+\infty,+\infty)=1 F(,y)=F(x,)=F(,)=0,F(+,+)=1

​ 4)非负性:对任意 x 1 < x 2 , y 1 < y 2 x_{1}<x_{2},y_{1}<y_{2} x1<x2y1<y2,有

P { x 1 < X ≤ x 2 , y 1 < Y < y 2 } = F ( x 2 , y 2 ) − F ( x 2 , y 1 ) − F ( x 1 , y 2 ) + F ( x 1 , y 1 ) ≥ 0 P\{x_{1} <X \le x_{2},y_{1}< Y< y_{2}\}=F(x_{2},y_{2})-F(x_{2},y_{1})-F(x_{1},y_{2})+F(x_{1},y_{1}) \ge 0 P{x1<Xx2,y1<Y<y2}=F(x2,y2)F(x2,y1)F(x1,y2)+F(x1,y1)0

1.3.2 边缘分布函数

边缘分布函数: 设二维随机变量 ( X , Y ) (X,Y) (X,Y)的联合分布函数为 F ( x , y ) F(x,y) F(x,y),随机变量 X X X Y Y Y的分布函数 F X ( x ) F_{X}(x) FX(x) F Y ( y ) F_{Y}(y) FY(y)分别称为 ( X , Y ) (X,Y) (X,Y)关于 X X X和关于 Y Y Y的边缘分布函数,由概率性质得
F X ( x ) = P { X ≤ x } = P { X ≤ x , Y < + ∞ } = lim ⁡ y → + ∞ P { X ≤ x , Y ≤ y } = lim ⁡ y → + ∞ F ( x , y ) = F ( x , + ∞ ) . 同理,有 F Y ( y ) = F ( + ∞ , y ) . \begin{aligned} F_{X}(x)=P\{X \le x\}=P\{X \le x,Y < +\infty\}\\ = \lim\limits_{y \to +\infty}{P\{X \le x,Y \le y\}}\\ =\lim\limits_{y \to +\infty}{F( x,y)}=F(x,+\infty).\\ 同理,有F_{Y}(y)=F(+\infty,y). \end{aligned} FX(x)=P{Xx}=P{Xx,Y<+}=y+limP{Xx,Yy}=y+limF(x,y)=F(x,+).同理,有FY(y)=F(+,y).

1.3.3 条件分布函数

条件分布函数: 设二维随机变量 ( X , Y ) (X,Y) (X,Y)的概率密度函数为 f ( x , y ) f(x,y) f(x,y) ( X , Y ) (X,Y) (X,Y)关于 Y Y Y的边缘概率密度为 f Y ( y ) f_{Y}(y) fY(y),若对固定的 y y y, f Y ( y ) > 0 f_{Y}(y)>0 fY(y)>0,则称 f ( x , y ) f Y ( y ) \frac{f(x,y)}{f_{Y}(y)} fY(y)f(x,y)为在 Y = y Y=y Y=y的条件下 X X X的条件概率密度,记为
f X ∣ Y ( x ∣ y ) = f ( x , y ) f Y ( y ) \begin{aligned} f_{X|Y}(x|y)=\frac{f(x,y)}{f_{Y}(y)} \end{aligned} fXY(xy)=fY(y)f(x,y)
∫ − ∞ x f X ∣ Y ( x ∣ y ) d x = ∫ − ∞ x f ( x , y ) f Y ( y ) d x \int_{-\infty}^{x}{f_{X|Y}(x|y)dx}=\int_{-\infty}^{x}{\frac{f(x,y)}{f_{Y}(y)}dx} xfXY(xy)dx=xfY(y)f(x,y)dx为在 Y = y Y=y Y=y的条件下 X X X的条件分布函数,记为 P { X ≤ x ∣ Y = y } P\{X \le x|Y=y\} P{XxY=y} F X ∣ Y ( x ∣ y ) F_{X|Y}(x|y) FXY(xy),即
F X ∣ Y ( x ∣ y ) = P { X ≤ x ∣ Y = y } = ∫ − ∞ x f ( x , y ) f Y ( y ) d x \begin{aligned} F_{X|Y}(x|y)=P\{X \le x | Y = y\}=\int_{-\infty}^{x}{\frac{f(x,y)}{f_{Y}(y)}dx} \end{aligned} FXY(xy)=P{XxY=y}=xfY(y)f(x,y)dx
同理,可以定义 f Y ∣ X ( y ∣ x ) = f ( x , y ) f X ( x ) f_{Y|X}(y|x)=\frac{f(x,y)}{f_{X}(x)} fYX(yx)=fX(x)f(x,y) F Y ∣ X ( y ∣ x ) = ∫ − ∞ y f ( x , y ) f X ( x ) d y F_{Y|X}(y|x)=\int_{-\infty}^{y}{\frac{f(x,y)}{f_{X}(x)}dy} FYX(yx)=yfX(x)f(x,y)dy

1.3.4 二维随机变量

1.离散型: ( X , Y ) ∼ P i j (X, Y) \sim P_{i j} (X,Y)Pij (联合分布律 ) ) )
条件分布为 P ( X = x i ∣ Y = y i ) = P ( X = x i , Y = y j ) P ( Y = y j ) = P i j P ⋅ j P\left(X=x_i \mid Y=y_i\right)=\frac{P\left(X=x_i, Y=y_j\right)}{P\left(Y=y_j\right)}=\frac{P_{i j}}{P_{\cdot j}} P(X=xiY=yi)=P(Y=yj)P(X=xi,Y=yj)=PjPij
P ( X = 1 ∣ Y = 0 ) = P 21 P ⋅ 1 条件 =  联合   边缘  P(X=1 \mid Y=0)=\frac{P_{21}}{P_{\cdot 1}}\\ \text{条件}=\frac{\text { 联合 }}{\text { 边缘 }} P(X=1Y=0)=P1P21条件= 边缘  联合 

  1. 连续型: ( X , Y ) ∼ f ( x , y ) (X, Y) \sim f(x, y) (X,Y)f(x,y) (联合概率密度)

    边缘分布函数 F X ( x ) = F ( x , + ∞ ) = ∫ − ∞ x [ ∫ − ∞ + ∞ f ( u , v ) d v ] d u F_{X}(x)=F(x,+\infty)=\int_{-\infty}^{x}[\int_{-\infty}^{+\infty}{f(u,v)dv}]du FX(x)=F(x,+)=x[+f(u,v)dv]du,边缘密度 f X ( x ) = ∫ − ∞ + ∞ f ( x , y ) d y , f Y ( y ) = ∫ − ∞ + ∞ f ( x , y ) d x f_X(x)=\int_{-\infty}^{+\infty} f(x, y) d y, f_Y(y)=\int_{-\infty}^{+\infty} f(x, y) d x fX(x)=+f(x,y)dy,fY(y)=+f(x,y)dx

​ 联合分布函数 F ( x , y ) = P { X ≤ x , Y ≤ y } = ∫ − ∞ y ∫ − ∞ x f ( u , v ) d u d v F(x,y)=P\{X \le x,Y \le y\}=\int_{-\infty}^{y}\int_{-\infty}^{x}{f(u,v)dudv} F(x,y)=P{Xx,Yy}=yxf(u,v)dudv,且联合密度 f ( x , y ) = ∂ 2 F ( x , y ) ∂ x ∂ y f(x,y)=\frac{\partial^{2}F(x,y)}{\partial x \partial y} f(x,y)=xy2F(x,y)

​ 条件分布函数 F X ∣ Y = ∫ − ∞ x f X ∣ Y ( x ∣ y ) d x = ∫ − ∞ x f ( x , y ) f Y ( y ) d x F_{X|Y}=\int_{-\infty}^{x}{f_{X|Y}(x|y)dx}=\int_{-\infty}^{x}{\frac{f(x, y)}{f_Y(y)}dx} FXY=xfXY(xy)dx=xfY(y)f(x,y)dx,条件密度 f X ∣ Y ( x ∣ y ) = f ( x , y ) f Y ( y ) f_{X \mid Y}(x \mid y)=\frac{f(x, y)}{f_Y(y)} fXY(xy)=fY(y)f(x,y)
​ 无论离散还是连续, 条件 =  联合   边缘  \text{条件}=\frac{\text { 联合 }}{\text { 边缘 }} 条件= 边缘  联合 

  1. 独立性: ( X , Y ) , X , Y (X, Y), X, Y (X,Y),X,Y 独立 ⟺ F ( x , y ) = F X ( x ) ⋅ F Y ( y ) \Longleftrightarrow F(x, y)=F_X(x) \cdot F_Y(y) F(x,y)=FX(x)FY(y)

⟺ P i j = P i ⋅ ⋅ P ⋅ j , ∀ i , j ⟺ f ( x , y ) = f X ( x ) ⋅ f Y ( y ) \begin{aligned} & \Longleftrightarrow P_{i j}=P_{i \cdot} \cdot P_{\cdot j}, \forall i, j \\ & \Longleftrightarrow f(x, y)=f_X(x) \cdot f_Y(y) \end{aligned} Pij=PiPj,i,jf(x,y)=fX(x)fY(y)

  1. 两个分布

    (1)均匀分布 ( X , Y ) ∼ f ( x , y ) = { 1 S D , ( x , y ) ∈ D 0 , ( x , y ) ∉ D (X, Y) \sim f(x, y)=\left\{\begin{array}{l}\frac{1}{S_D},(x, y) \in D \\ 0,(x, y) \notin D\end{array}\right. (X,Y)f(x,y)={SD1,(x,y)D0,(x,y)/D
    (2)正态分布 ( X , Y ) ∼ N ( μ 1 , μ 2 , σ 1 2 , σ 2 2 , ρ ) (X, Y) \sim N\left(\mu_1, \mu_2, \sigma_1^2, \sigma_2^2, \rho\right) (X,Y)N(μ1,μ2,σ12,σ22,ρ)
    其中 E ( X ) = μ 1 , E ( Y ) = μ 2 , D ( X ) = σ 1 2 , D ( Y ) = σ 2 2 , e x y = ρ E (X)=\mu_1, E (Y)=\mu_2, D (X)=\sigma_1^2, D (Y)=\sigma_2^2, e_{x y}=\rho E(X)=μ1,E(Y)=μ2,D(X)=σ12,D(Y)=σ22,exy=ρ

[注]:求谁不积谁,不积分先定限,限内画条线,先交写下限,后交写上限。

1.4 数字特征

1.4.1 一维随机变量的数字特征

1.数学期望:

​ 1)一维随机变量的数学期望: E ( X ) { X ∼ P i ⟹ E ( X ) = ∑ i x i P i X ∼ f ( x ) ⟹ E ( X ) = ∫ − ∞ + ∞ f ( x ) d x E (X)\left\{\begin{array}{l}X \sim P_i \Longrightarrow E (X)=\sum_i x_i P_i \\ X \sim f(x) \Longrightarrow E (X)=\int_{-\infty}^{+\infty} f(x) d x\end{array}\right. E(X){XPiE(X)=ixiPiXf(x)E(X)=+f(x)dx

​ 2)一维随机变量函数的数学期望: E ( Y ) { X ∼ p i , Y = g ( X ) ⟹ E ( Y ) = ∑ i g ( x i ) p i X ∼ f ( x ) , Y = g ( X ) ⟹ E ( Y ) = ∫ − ∞ + ∞ g ( x ) f ( x ) d x E (Y)\left\{\begin{array}{l} X \sim p_i, Y=g(X) \Longrightarrow E (Y)=\sum_i g\left(x_i\right) p_i \\X \sim f(x), Y=g(X) \Longrightarrow E (Y)=\int_{-\infty}^{+\infty} g(x) f(x) d x \end{array}\right. E(Y){Xpi,Y=g(X)E(Y)=ig(xi)piXf(x),Y=g(X)E(Y)=+g(x)f(x)dx

2.方差、标准差:
D ( X ) = E [ ( X − E ( X ) ) 2 ] \begin{aligned} D (X)=E\left[(X-E (X))^2\right] \end{aligned} D(X)=E[(XE(X))2]
​ 1)定义法: { X ∼ p i ⟹ D ( X ) = E [ ( X − E ( X ) ) 2 ] = ∑ i ( x i − E ( X ) ) 2 p i X ∼ f ( x ) ⟹ D ( X ) = E [ ( X − E ( X ) ) 2 ] = ∫ − ∞ + ∞ ( x − E ( X ) ) 2 f ( x ) d x \left\{\begin{array}{l}X \sim p_i \Longrightarrow D (X)=E\left[(X-E (X))^2\right]=\sum_i\left(x_i-E (X)\right)^2 p_i \\ X \sim f(x) \Longrightarrow D (X)=E\left[(X-E (X))^2\right]=\int_{-\infty}^{+\infty}(x-E (X))^2 f(x) d x\end{array}\right. {XpiD(X)=E[(XE(X))2]=i(xiE(X))2piXf(x)D(X)=E[(XE(X))2]=+(xE(X))2f(x)dx

​ 2)公式法: D ( X ) = E [ ( X − E ( X ) ) 2 ] = E [ X 2 − 2 ⋅ X ⋅ E X + ( E ( X ) ) 2 ] = E ( X 2 ) − 2 ⋅ E ( X ) ⋅ E ( X ) + ( E X ) 2 ] \left.D (X)=E\left[(X-E (X))^2\right]=E\left[X^2-2 \cdot X \cdot E X+(E (X))^2\right]=E\left(X^2\right)-2 \cdot E (X) \cdot E (X)+(E X)^2\right] D(X)=E[(XE(X))2]=E[X22XEX+(E(X))2]=E(X2)2E(X)E(X)+(EX)2] ,即 D X = E ( X 2 ) − ( E X ) 2 D X=E\left(X^2\right)-(E X)^2 DX=E(X2)(EX)2

3.性质:

​ (1) E a = a , E ( E ( X ) = E ( X ) E a=a, E(E (X)=E (X) Ea=a,E(E(X)=E(X)
​ (2) E ( a X + b Y ) = a E ( X ) + b E ( Y ) , E ( ∑ i = 1 n a i X i ) = ∑ i = 1 n a i E ( X i ) E(a X+b Y)=a E (X)+b E (Y), E\left(\sum_{i=1}^n a_i X_i\right)=\sum_{i=1}^n a_i E (X_i) E(aX+bY)=aE(X)+bE(Y),E(i=1naiXi)=i=1naiE(Xi) (无条件)
​ (3) 若 X , Y X, Y X,Y 相互独立, 则 E ( X Y ) = E ( X ) E ( Y ) E(X Y)=E (X) E (Y) E(XY)=E(X)E(Y)
​ (4) D a = 0 , D ( E ( X ) = 0 , D ( D ( X ) = 0 D a=0, D(E (X)=0, D(D (X)=0 Da=0,D(E(X)=0,D(D(X)=0
​ (5) 若 X , Y X, Y X,Y 相互独立, 则 D ( X ± Y ) = D X + D Y D(X \pm Y)=D X+D Y D(X±Y)=DX+DY
​ (6) D ( a X + b ) = a 2 D X , E ( a X + b ) = a E X + b D(a X+b)=a^2 D X, E(a X+b)=a E X+b D(aX+b)=a2DX,E(aX+b)=aEX+b
​ (7)一般, D ( X ± Y ) = D ( X ) + D ( Y ) ± 2 Cov ⁡ ( X , Y ) D(X \pm Y)=D (X)+D (Y) \pm 2 \operatorname{Cov}(X, Y) D(X±Y)=D(X)+D(Y)±2Cov(X,Y)
D ( ∑ i = 1 n X i ) = ∑ i = 1 n D X i + 2 ∑ 1 ≤ i < j ≤ n Cov ⁡ ( x i , x j ) D\left(\sum_{i=1}^n X_i\right)=\sum_{i=1}^n D X_i+2 \sum_{1 \leq i<j \leq n} \operatorname{Cov}\left(x_i, x_j\right) D(i=1nXi)=i=1nDXi+21i<jnCov(xi,xj)
[注] 1. 0 − 1 0-1 01 分布, E X = p , D X = p − p 2 = ( 1 − p ) p , X ∼ ( 1 0 p 1 − p ) E X=p, D X=p-p^2=(1-p) p, X \sim\left(\begin{array}{cc}1 & 0 \\ p & 1-p\end{array}\right) EX=p,DX=pp2=(1p)p,X(1p01p)

  1. X ∼ B ( n , p ) , E X = n p , D X = n p ( 1 − p ) X \sim B(n, p), E X=n p, D X=n p(1-p) XB(n,p),EX=np,DX=np(1p)
  2. X ∼ P ( λ ) , E X = λ , D X = λ X \sim P(\lambda), E X=\lambda, D X=\lambda XP(λ),EX=λ,DX=λ
  3. X ∼ G e ( p ) , E X = 1 p , D X = 1 − p p 2 X \sim G e(p), E X=\frac{1}{p}, D X=\frac{1-p}{p^2} XGe(p),EX=p1,DX=p21p
  4. X ∼ U [ a , b ] , E X = a + b 2 , D X = ( b − a ) 2 12 X \sim U[a, b], E X=\frac{a+b}{2}, D X=\frac{(b-a)^2}{12} XU[a,b],EX=2a+b,DX=12(ba)2
  5. X ∼ E X ( λ ) , E X = 1 λ , D X = 1 λ 2 X \sim E_X(\lambda), E X=\frac{1}{\lambda}, D X=\frac{1}{\lambda^2} XEX(λ),EX=λ1,DX=λ21
  6. X ∼ N ( μ , σ 2 ) , E X = μ , D X = σ 2 X \sim N\left(\mu, \sigma^2\right), E X=\mu, D X=\sigma^2 XN(μ,σ2),EX=μ,DX=σ2
  7. X ∼ χ 2 ( n ) , E X = n , D X = 2 n X \sim \chi^2(n), E X=n, D X=2 n Xχ2(n),EX=n,DX=2n

1.4.2 二维随机变量的数字特征

1.数学期望:

​ 1)离散型: ( X , Y ) ∼ p i j , Z = g ( X , Y ) ⟹ E Z = ∑ i ∑ j g ( x i , y i ) p i j (X, Y) \sim p_{i j}, Z=g(X, Y) \Longrightarrow E Z=\sum_i \sum_j g\left(x_i, y_i\right) p_{i j} (X,Y)pij,Z=g(X,Y)EZ=ijg(xi,yi)pij

​ 2)连续型: ( X , Y ) ∼ f ( x , y ) , Z = g ( X , Y ) ⟹ E Z = ∫ − ∞ + ∞ ∫ − ∞ + ∞ g ( x , y ) f ( x , y ) d x d y (X, Y) \sim f(x, y), Z=g(X, Y) \Longrightarrow E Z=\int_{-\infty}^{+\infty} \int_{-\infty}^{+\infty} g(x, y) f(x, y) d x d y (X,Y)f(x,y),Z=g(X,Y)EZ=++g(x,y)f(x,y)dxdy

2.协方差和相关系数:

Cov ⁡ ( X , Y ) = E [ X − E ( X ) ) ( Y − E ( Y ) ) ] , Cov ⁡ ( X , X ) = E [ ( X − E ( X ) ) ( X − E ( X ) ) ] = E [ ( X − E X ) 2 ] = D ( X ) \operatorname{Cov}(X, Y)=E[X-E (X))(Y-E (Y))], \operatorname{Cov}(X, X)=E[(X-E (X))(X-E (X))]=E\left[(X-E X)^2\right]=D (X) Cov(X,Y)=E[XE(X))(YE(Y))],Cov(X,X)=E[(XE(X))(XE(X))]=E[(XEX)2]=D(X)

  1. 定义法:

{ ( X , Y ) ∼ p i j ⟹ Cov ⁡ ( X , Y ) = ∑ i ∑ j ( x i − E ( X ) ) ( u i − E ( Y ) ) p i j ( X , Y ) ∼ f ( x , y ) ⟹ Cov ⁡ ( X , Y ) = ∫ − ∞ + ∞ ∫ − ∞ + ∞ ( x − E ( X ) ) ( y − E ( Y ) ) f ( x , y ) d x d y \left\{\begin{array}{l} (X, Y) \sim p_{i j} \Longrightarrow \operatorname{Cov}(X, Y)=\sum_i \sum_j\left(x_i-E (X)\right)\left(u_i-E (Y)\right) p_{i j} \\ (X, Y) \sim f(x, y) \Longrightarrow \operatorname{Cov}(X, Y)=\int_{-\infty}^{+\infty} \int_{-\infty}^{+\infty}(x-E (X))(y-E (Y)) f(x, y) d x d y \end{array}\right. {(X,Y)pijCov(X,Y)=ij(xiE(X))(uiE(Y))pij(X,Y)f(x,y)Cov(X,Y)=++(xE(X))(yE(Y))f(x,y)dxdy

  1. 公式法:

Cov ⁡ ( X , Y ) = E ( X Y − X ⋅ E ( Y ) − E ( X ) ⋅ Y + E ( X ) ⋅ E ( Y ) ) = E ( X Y ) − E ( X ) ⋅ E ( Y ) − E ( X ) ⋅ E ( Y ) + E ( X ) ⋅ E ( Y ) = E ( X Y ) − E ( X ) E ( Y ) \begin{aligned} & \operatorname{Cov}(X, Y)=E(X Y-X \cdot E (Y)-E (X) \cdot Y+E (X) \cdot E (Y)) \\ & =E(X Y)-E (X) \cdot E (Y)-E (X) \cdot E (Y)+E (X) \cdot E (Y)=E(X Y)-E (X) E (Y) \end{aligned} Cov(X,Y)=E(XYXE(Y)E(X)Y+E(X)E(Y))=E(XY)E(X)E(Y)E(X)E(Y)+E(X)E(Y)=E(XY)E(X)E(Y)

 3.  ρ X Y = Cov ⁡ ( X , Y ) D X D Y { = 0 ⟺ X , Y  不相关  ≠ 0 ⟺ X , Y  相关  \text { 3. } \rho_{X Y}=\frac{\operatorname{Cov}(X, Y)}{\sqrt{D X} \sqrt{D Y}}\left\{\begin{array}{l} =0 \Longleftrightarrow X, Y \text { 不相关 } \\ \neq 0 \Longleftrightarrow X, Y \text { 相关 } \end{array}\right.  3. ρXY=DX DY Cov(X,Y){=0X,Y 不相关 =0X,Y 相关 

3.性质:

  1. Cov ⁡ ( X , Y ) = Cov ⁡ ( Y , X ) \operatorname{Cov}(X, Y)=\operatorname{Cov}(Y, X) Cov(X,Y)=Cov(Y,X)

  2. Cov ⁡ ( a X , b Y ) = a b Cov ⁡ ( X , Y ) \operatorname{Cov}(a X, b Y)=a b \operatorname{Cov}(X, Y) Cov(aX,bY)=abCov(X,Y)

  3. Cov ⁡ ( X 1 + X 2 , Y ) = Cov ⁡ ( X 1 , Y ) + Cov ⁡ ( X 2 , Y ) \operatorname{Cov}\left(X_1+X_2, Y\right)=\operatorname{Cov}\left(X_1, Y\right)+\operatorname{Cov}\left(X_2, Y\right) Cov(X1+X2,Y)=Cov(X1,Y)+Cov(X2,Y)

  4. ∣ ρ X Y ∣ ≤ 1 \left|\rho_{X Y}\right| \leq 1 ρXY1

 5.  ρ X Y = 1 ⟺ P { Y = a X + b } = 1 ( a > 0 ) , ρ X Y = − 1 ⟺ P { Y = a X + b } = 1 ( a < 0 ) \text { 5. } \rho_{X Y}=1 \Longleftrightarrow P\{Y=a X+b\}=1(a>0), \rho_{X Y}=-1 \Longleftrightarrow P\{Y=a X+b\}=1(a<0)  5. ρXY=1P{Y=aX+b}=1(a>0),ρXY=1P{Y=aX+b}=1(a<0)

考试时: Y = a X + b , a > 0 ⟹ ρ X Y = 1 , Y = a X + b , a < 0 ⟹ ρ X Y = − 1 Y=a X+b, a>0 \Longrightarrow \rho_{X Y}=1, Y=a X+b, a<0 \Longrightarrow \rho_{X Y}=-1 Y=aX+b,a>0ρXY=1,Y=aX+b,a<0ρXY=1
小结:五个充要条件
ρ X Y = 0 ⟺ { Cov ⁡ ( X , Y ) = 0 E ( X Y ) = E ( X ) ⋅ E ( Y ) D ( X + Y ) = D ( X ) + D ( Y ) D ( X − Y ) = D ( X ) + D ( Y ) \begin{aligned} & \rho_{X Y}=0 \Longleftrightarrow\left\{\begin{array}{l} \operatorname{Cov}(X, Y)=0 \\ E(X Y)=E (X) \cdot E (Y) \\ D(X+Y)=D (X)+D (Y) \\ D(X-Y)=D (X)+D (Y) \end{array}\right. \\ \end{aligned} ρXY=0 Cov(X,Y)=0E(XY)=E(X)E(Y)D(X+Y)=D(X)+D(Y)D(XY)=D(X)+D(Y)

1.4.3 独立性和相关性的判定

X , Y  独立  ⟹ ρ X Y = 0  若  ( X , Y ) ∼ N ( μ , σ 2 ) ,  则  X , Y  独立  ⟺ X , Y  不相关  ( ρ X Y = 0 ) \begin{aligned} & X, Y \text { 独立 } \Longrightarrow \rho_{X Y}=0 \\ & \text { 若 }(X, Y) \sim N\left(\mu, \sigma^2\right), \text { 则 } X, Y \text { 独立 } \Longleftrightarrow X, Y \text { 不相关 }\left(\rho_{X Y}=0\right) \end{aligned} X,Y 独立 ρXY=0  (X,Y)N(μ,σ2),  X,Y 独立 X,Y 不相关 (ρXY=0)