概率论 Cheat Sheet 3:条件概率与贝叶斯公式
Contents [show]
1. 条件概率
对于事件 E 和 F,使用 P(E|F) 表示在 F 已经发生的情况下,E 发生的概率。对于 P(E|F),如果 F 已经发生了,那么为了让 E 也发生,其结果必然既属于 E 又属于 F,即这个结果必然属于 EF。在 F 已经发生的前提下,F 成了新的样本空间,因此 E 发生的(条件)概率等于 EF 发生的概率与 F 发生的概率之比。
定义 如果 P(F)>0,那么
P(E|F)=P(EF)P(F)
式 (1) 的两边同时乘以 P(F),可以得到
P(EF)=P(F)P(E|F)
式 (2) 表明 E 和 F 同时发生的概率,等于 F 发生的概率乘以在 F 发生的条件下 E 发生的条件概率。这在计算事件的交的概率时非常有用。
式 (1) 的推广也称为乘法规则,可以用于计算任意个事件交的概率。
乘法规则
P(E1E2E3⋯En)=P(E1)P(E2|E1)P(E3|E1E2)⋯P(En|E1⋯En−1)
2. P(·|F) 是概率
条件概率满足普通概率的所有性质,以下命题证明了条件概率 P(E|F) 满足概率的三条公理。
命题
(a) 0≤P(E|F)≤1
(b) P(S|F)=1
(c) 若 Ei(i=1,2,⋯)为互不相容的事件序列,则
P(∞⋃i=1Ei|F)=∞∑i=1P(Ei|F)
如果已知 F 发生的条件下,E1 发生的概率不因 E2 是否发生而改变,则称事件 E1 和 E2 关于给定事件 F 是条件独立的(Conditionally Independent)。更确切地,如果
P(E1|E2F)=P(E1|F)
或等价地
P(E1E2|F)=P(E1|F)P(E2|F)
则称 E1 和 E2 关于 F 是条件独立的。
3. 贝叶斯公式
设 E 和 F 为两个事件,E 可以表示为
E=EF⋃EFc
上式表明,E 中的结果要么同时属于 E 和 F,要么只属于 E 但不属于 F。显然 EF 和 EFc 是不相容的,由公理 3,可得
P(E)=P(EF)+P(EFc)=P(E|F)P(F)+P(E|Fc)P(Fc)=P(E|F)P(F)+P(E|Fc)[1–P(F)]
式 (4) 说明事件 E 发生的概率等于 F 发生的条件下 E 发生的条件概率,与在 F 不发生条件下 E 发生的条件概率的加权平均,其中加在每个条件概率上的权重就是作为条件的事件发生的概率。
通过式 (4),可以用第二个事件是否发生作为条件,来计算第一个事件的概率。在一些问题中,直接计算某个概率可能很困难,但是只要知道第二个事件是否发生,就容易计算了。
由式 (1)、(2)、(4),可以进一步得到
P(F|E)=P(FE)P(E)=P(E|F)P(F)P(E|F)P(F)+P(E|Fc)P(Fc)
利用上式可以根据附加信息(E)对某事件(F)的概率进行修正。例如计算新的证据(E)对某个特定假设(H)成立的概率的影响,有
P(H|E)=P(HE)P(E)=P(E|H)P(H)P(E|H)P(H)+P(E|Hc)[1–P(H)]
如果新证据 E 支持假设 H 成立,即 P(H|E)≥P(H),由上式可以得到
P(E|H)≥P(E|H)P(H)+P(E|Hc)[1–P(H)]
将 P(E|H)P(H) 移到不等号左边,得到
P(E|H)–P(E|H)P(H)≥+P(E|Hc)[1–P(H)]P(E|H)(1–P(H))≥P(E|Hc)[1–P(H)]
即
P(E|H)≥P(E|Hc)
上式说明,如果新证据 E 在假设 H 成立时发生的概率大于假设不成立时发生的概率,则可以认为新证据支持假设。
定义 事件 A 的优势比定义为
P(A)P(Ac)=P(A)1–P(A)
事件 A 的优势比描述事件发生的可能性是事件不发生的可能性的倍数。例如,假设 P(A)=2/3,则有 P(A)=2P(Ac),故事件 A 的优势比为 2。如果事件的优势比等于 α,则通常称支持假设成立的优势比为 α:1。
考虑假设 H 以概率 P(H) 成立,如果发现了新的证据 E,那么在 E 成立的条件下,H 成立和 H 不成立的条件概率分别为
P(H|E)=P(E|H)P(H)P(E)P(Hc|E)=P(E|Hc)P(Hc)P(E)
由此可得,引入新证据 E 后,假设 H 的新优势比为
P(H|E)P(Hc|E)=P(H)P(Hc)P(E|H)P(E|Hc)
即 H 的新优势比值等于它原来的优势比值、乘以新的证据在 H 和 Hc 之下的条件概率比值。如果 E 在 H 成立的条件下发生的概率大于在 Hc 成立的条件下发生的概率,则 H 的优势比值增加,表明新证据 E 支持假设 H。
全概率公式 式 (4) 可以推广如下:假设 F1,F2,⋯,Fn 是互不相容的事件,且这些事件必然有一件发生,即
n⋃i=1Fi=S
记
E=n⋃i=1EFi
又由于事件 EFi(i=1,⋯,n)是互不相容的,则有
P(E)=n∑i=1P(EFi)=n∑i=1P(E|Fi)P(Fi)
式 (7) 称为全概率公式,对于事件 F1,F2,⋯,Fn,可以用 Fi 是否发生为条件,来计算 P(E)。式 (7) 表明,P(E) 等于 P(E|Fi) 的加权平均,每项的权为事件 Fi 发生的概率。
贝叶斯公式
P(Fj|E)=P(EFj)P(E)=P(E|Fj)P(Fj)n∑i=1P(E|Fi)P(Fi)
如果将事件 Fi 想象成关于某个问题的各个假设,则贝叶斯公式描述了如何根据试验结果 E 来修正试验之前对这些假设所做的判断,即 P(Fj)。