Think Bayes Note 7: 奥利弗的血迹
1. 问题描述
在一个犯罪现场中,发现了两个人的血迹,其中一个是 O 型血(当地人口中有 60% 是 O 血型),另一个是 AB 型(当地人口中有 1% 是 AB 型)。现有一名嫌疑犯奥利弗是 O 型血,那么这些证据是否支持奥利弗是嫌疑犯(在现场留下血迹的人)?
2. 求解
假设 $H_A$ 为奥利弗是嫌疑犯,$H_B$ 为奥利弗不是嫌疑犯。记 $D$ 为现场发现了 O 型血和 AB 型血。由贝叶斯公式
\begin{equation}
P(H|D) = \frac{P(H)P(D|H)}{P(D)} \tag{1}
\end{equation}
可得 $H_A$ 和 $H_B$ 后验概率的比值为:
\begin{equation}
\frac{P(H_A|D)}{P(H_B|D)} = \frac{P(H_A)P(D|H_A)}{P(H_B)P(D|H_B)} \tag{2}
\end{equation}
这里 $H_A$ 和 $H_B$ 是互斥的,且 $P(H_B) = 1 – P(H_A)$,式 (2) 中的 $\frac{P(H_A)}{P(H_B)}$ 可以看做是 $P(H_A)$ 相对于 $P(H_B)$ 的胜率,这里记为 $o(H_A)$;同理,$\frac{P(H_A|D)}{P(H_B|D)}$ 可以看做是 $P(H_A|D)$ 相对于 $P(H_B|D)$ 的胜率,记为 $o(H_A|D)$,则式 (2) 变为:
\begin{equation}
o(H_A|D) = o(A)\frac{P(D|H_A)}{P(D|H_B)} \tag{3}
\end{equation}
也可以写成:
\begin{equation}
\frac{o(H_A|D)}{o(H_A)} = \frac{P(D|H_A)}{P(D|H_B)} \tag{4}
\end{equation}
式 (4) 左边是后验概率和先验概率的比值,右边是似然比,也称贝叶斯因子。如果贝叶斯因子大于 1,则说明随着 $D$ 的发生,$H_A$ 的胜率增加了,即 $D$ 更可能支持假设 $H_A$ 而不是 $H_B$;反之,如果贝叶斯因子小于 1,则说明数据更可能支持假设 $H_B$ 而不是 $H_A$。
回到一开始的问题中,如果 $H_A$ 成立,即奥利弗是嫌疑犯,则现场的 O 型血迹来自奥利弗,AB 型血迹来自其他人。从当地人中任选一人,是 AB 型血的概率为 $1\%$,故有:
\begin{equation}
P(D|H_A) = 1\% \tag{5}
\end{equation}
如果 $H_B$ 成立,即奥利弗不是嫌疑犯,则现场的两个血迹都来自当地的其他人。从当地人中任选两人,第一个人是 O 型血、第二个人是 AB 型血,或者第一个人是 AB 型血、第二个人是 O 型血的概率为 $A_2^{2} \times 60\% \times 1\% = 1.2\%$,故有:
\begin{equation}
P(D|H_B) = 1.2\% \tag{6}
\end{equation}
将式 (5)、(6) 带入式 (4),得到:
\begin{equation}
\frac{o(H_A|D)}{o(H_A)} = \frac{P(D|H_A)}{P(D|H_B)} = \frac{1\%}{1.2\%} = \frac{5}{6} \tag{7}
\end{equation}
可见 $\frac{o(H_A|D)}{o(H_A)}$ 的值小于 1,事件 D 不支持 $H_A$,即这些证据没有支持奥利弗是嫌疑犯。