Think Bayes Note 7: 奥利弗的血迹
Contents [show]
1. 问题描述
在一个犯罪现场中,发现了两个人的血迹,其中一个是 O 型血(当地人口中有 60% 是 O 血型),另一个是 AB 型(当地人口中有 1% 是 AB 型)。现有一名嫌疑犯奥利弗是 O 型血,那么这些证据是否支持奥利弗是嫌疑犯(在现场留下血迹的人)?
2. 求解
假设 HA 为奥利弗是嫌疑犯,HB 为奥利弗不是嫌疑犯。记 D 为现场发现了 O 型血和 AB 型血。由贝叶斯公式
P(H|D)=P(H)P(D|H)P(D)
可得 HA 和 HB 后验概率的比值为:
P(HA|D)P(HB|D)=P(HA)P(D|HA)P(HB)P(D|HB)
这里 HA 和 HB 是互斥的,且 P(H_B) = 1 – P(H_A),式 (2) 中的 \frac{P(H_A)}{P(H_B)} 可以看做是 P(H_A) 相对于 P(H_B) 的胜率,这里记为 o(H_A);同理,\frac{P(H_A|D)}{P(H_B|D)} 可以看做是 P(H_A|D) 相对于 P(H_B|D) 的胜率,记为 o(H_A|D),则式 (2) 变为:
\begin{equation} o(H_A|D) = o(A)\frac{P(D|H_A)}{P(D|H_B)} \tag{3} \end{equation}
也可以写成:
\begin{equation} \frac{o(H_A|D)}{o(H_A)} = \frac{P(D|H_A)}{P(D|H_B)} \tag{4} \end{equation}
式 (4) 左边是后验概率和先验概率的比值,右边是似然比,也称贝叶斯因子。如果贝叶斯因子大于 1,则说明随着 D 的发生,H_A 的胜率增加了,即 D 更可能支持假设 H_A 而不是 H_B;反之,如果贝叶斯因子小于 1,则说明数据更可能支持假设 H_B 而不是 H_A。
回到一开始的问题中,如果 H_A 成立,即奥利弗是嫌疑犯,则现场的 O 型血迹来自奥利弗,AB 型血迹来自其他人。从当地人中任选一人,是 AB 型血的概率为 1\%,故有:
\begin{equation} P(D|H_A) = 1\% \tag{5} \end{equation}
如果 H_B 成立,即奥利弗不是嫌疑犯,则现场的两个血迹都来自当地的其他人。从当地人中任选两人,第一个人是 O 型血、第二个人是 AB 型血,或者第一个人是 AB 型血、第二个人是 O 型血的概率为 A_2^{2} \times 60\% \times 1\% = 1.2\%,故有:
\begin{equation} P(D|H_B) = 1.2\% \tag{6} \end{equation}
将式 (5)、(6) 带入式 (4),得到:
\begin{equation} \frac{o(H_A|D)}{o(H_A)} = \frac{P(D|H_A)}{P(D|H_B)} = \frac{1\%}{1.2\%} = \frac{5}{6} \tag{7} \end{equation}
可见 \frac{o(H_A|D)}{o(H_A)} 的值小于 1,事件 D 不支持 H_A,即这些证据没有支持奥利弗是嫌疑犯。