Think Bayes Note 6: 欧元硬币问题
1. 问题描述 2000 年 1 月 4 日,《卫报》上刊载了一条统计相关的声明:以边缘转动比利时一欧元硬币 250 次后,得到正面 140 次,反面 110 次。由这一结果,是否可以认为硬币是不均匀的? 2. 计算后验概率 假设 $H_x$ 为转动硬币得到正面朝上的概率为 $x\%$,$0 \leq x \leq 100$。如果硬币是均匀的,则 $x\%$ 应接近 $50\%$。 定…
Read more
learn, build, evaluate
1. 问题描述 2000 年 1 月 4 日,《卫报》上刊载了一条统计相关的声明:以边缘转动比利时一欧元硬币 250 次后,得到正面 140 次,反面 110 次。由这一结果,是否可以认为硬币是不均匀的? 2. 计算后验概率 假设 $H_x$ 为转动硬币得到正面朝上的概率为 $x\%$,$0 \leq x \leq 100$。如果硬币是均匀的,则 $x\%$ 应接近 $50\%$。 定…
Read more
1. 问题描述 铁路上有 N 个火车头,依次编号为 1 到 N,有一天你看到了一个编号为 60 的火车头,估计铁路上一共有多少个火车头。 2. 推导求解 在看到任何火车头之前,我们只知道铁路上有 N 个火车头,为了能够进一步分析,先假设火车头总数 N 不会超过 1000,且在 1 到 1000 的范围内均匀分布。假设 $H_n$ 为铁路上有 $n$ 个火车头,则有: \begin{equa…
Read more
1. 问题描述 有一盒骰子,里面有 4 面、6 面、8 面、12 面、20 面的骰子各 1 个。现从这盒骰子中随机选出一个,投掷得到了 6,求每个骰子被选中的概率是多少。 2. 推导求解 假设 $H_4$、$H_6$、$H_8$、$H_12$、$H_20$ 分别为选中了 4 面、6 面、8 面、12 面、20 面的骰子,记 $D$ 为投掷得到了 6。 认为每个骰子被选中的先验概率相同,…
Read more
1. 问题描述 M&M 豆是一种混合各种颜色的巧克力豆,生产厂商会不时地调整各种颜色的巧克力豆之间的比例。1995 年之前,一袋 M&M 豆的颜色比例为:30% 褐色,20% 黄色,10% 绿色,10% 橙色,10% 黄褐色。1995 年推出了蓝色巧克力豆,此时一袋 M&M 豆的颜色比例变为:24% 蓝色,20% 绿色,16% 橙色,14% 黄色,13% 红色,13% …
Read more
1. 问题描述 Monty Hall 是一个名为 Let’s Make a Deal 的电视节目的主持人,Monty Hall 问题 的描述为,假设你参加了一个游戏节目,面前有三扇关着的大门,其中一扇门后面有一辆汽车,另外两扇门后面则各有一头山羊,如果你能猜中哪扇门后有汽车,就可以赢得汽车作为奖品。 首先,你要先选择一扇门(记选择的门为门 A,另外两扇门为门 B 和门 C)。在…
Read more
本系列为《贝叶斯思维:统计建模的Python学习法》一书的笔记,基于 Python 3 和 Pandas 重新实现了各个例子,并给出更详细的推导和说明。 1. 问题描述 假设有两碗曲奇饼干,一个碗(记为“碗 1”)里有 30 个香草饼干和 10 个巧克力饼干,另一个碗(记为“碗 2”)里有香草饼干和巧克力饼干各 20 个。现闭着眼睛从随机一个碗中拿出一块饼干,得到了一块香草饼干,求这个饼干…
Read more
3. 协方差及相关系数 定义 量 $E\{[X – E(X)][Y – E(Y)]\}$ 称为随机变量 $X$ 与 $Y$ 的协方差。记为 $Cov(X, Y)$,即 \begin{equation} Cov(X, Y) = $E\{[X – E(X)][Y – E(Y)]\} \end{equation} 而 \…
Read more
1. 数学期望 定义 设离散型随机变量 $X$ 的分布律为 \begin{equation} P\{X=x_k\} = p_k, \; k=1,2,\cdots \end{equation} 若级数 \begin{equation} \sum_{k=1}^{\infty}x_k p_k \end{equation} 绝对收敛,则称级数 $\sum\limits_{k=1}^{\…
Read more
4. 相互独立的随机变量 定义 设 $F(x, y)$ 及 $F_X(x), F_Y(y)$ 分别是二维随机变量 $(X, Y)$ 的分布函数及边缘分布函数。若对于所有 $x, y$ 有 \begin{equation} P\{X \leq x, Y \leq y\} = P\{X \leq x\} P\{Y \leq y\} \tag{4.1}…
Read more
2. 边缘分布 二维随机变量 $(X, Y)$ 作为一个整体,具有分布函数 $F(x, y)$。而 $X$ 和 $Y$ 都是随机变量,各自也有分布函数。将它们分别记为 $F_X(x)$,$F_Y(y)$,依次称为二维随机变量 $(X, Y)$ 关于 $X$ 和关于 $Y$ 的边缘分布函数。边缘分布函数可以由 $(X, Y)$ 的分布函数 $F(x, y)$ 所确定,事实上, \begin{eq…
Read more