贝叶斯派与频率派之间的对立关系

2021年9月17日22:53:38贝叶斯派与频率派之间的对立关系已关闭评论

频率派与贝叶斯派之间存在对立关系。

如果将两者之间的区别用一句话来概括的话,那就是“是否在事前预测某种概率”。

为了理解两者之间的区别,让我们假设有两种硬币。一种是出现正面和出现背面的概率都是50%的“真正的硬币”,另一种是出现正面的概率是80%、出现背面的概率是20%的“老千硬币”。我们假设这两种硬币的外形和重量完全相同,然后各投掷一定的次数,对出现的结果进行统计和分析,判断究竟是哪一种硬币。

频率派的思考方式很简单

频率派就是基于费希尔那种思考方式的统计学家。如果投掷10次全都出现正面的话,那么这枚硬币究竟是真正的硬币还是“老千硬币”呢?频率派首先会假设“这枚硬币是真的”,然后根据这个假设计算投掷10次全部正面朝上的概率。“在正面朝上的概率达50%的条件下,偶然10次全部出现正面朝上的概率是2的10次方分之一,也就是只有0.10%。”这和前文中出现的那个妇人“猜对全部10杯奶茶的概率”是一样的,这个0.10%的概率也被称为p值。那么相比这个堪称奇迹的概率,否定“这枚硬币是真的”的假设才是比较理智的判断吧。

接下来,假设“这枚硬币是老千硬币”,进行与之前同样的计算。“正面朝上的概率达80%的条件下,偶然10次全部出现正面的概率是10.74%”。p值为10.74%的话,就算不上是奇迹了。所以,这个假设是可以成立的。

既然“这枚硬币是真的”的假设不成立,而“这枚硬币是老千硬币”的假设成立,那么就可以认为这枚硬币是“老千硬币”了吧。更简单地说,只要将这枚硬币投掷10000次,然后计算其出现了多少次正面朝上的情况即可。大概真正的硬币出现正面朝上的次数约为5000次,而“老千硬币”出现正面的次数约为8000次。所谓频率派,就是指在“无数次的试验”中出现结果的“频率”。而且,在这种情况下真正的硬币出现正面朝上次数为8000次的p值和“老千硬币”出现正面朝上次数为5000次的p值都非常低。

贝叶斯派的“事前概率”与“事后概率”

贝叶斯派在对这枚硬币进行判断的时候,首先会在没有任何信息的时候考虑这枚硬币有多大的概率是真硬币或“老千硬币”。这种概率被称为事前概率。事前概率的数值是多少都无所谓,暂时假设概率为50%。然后根据和之前相同的“10次投掷全部出现正面朝上”这一结果进行推测。

前半部分的计算过程和结果与频率派完全一样,最后都是0.10%和10.47%,但接下来的结算方法就有所不同了。

贝叶斯派会将附加结果计算出来的概率分别乘以事前概率。在这种情况下的计算结果如下:

①真正的硬币的事前概率×真正的硬币10次全部出现正面的附加结果概率

=50%×0.10%
=0.05%

②“老千硬币”的事前概率ד老千硬币”10次全部出现正面的附加结果概率

=50%×10.74%
=5.37%

另外,因为我们只有真正的硬币和“老千硬币”这两个选项,那么不管在什么情况下,选中真正硬币和“老千硬币”的概率之和必定是1。这一点,即便在“10次全部出现正面朝上”的情况下也不例外,也就是说①与②的合计值应该是“1”。

再详细一点说的话,就是①“真正的硬币连续投掷10次都出现正面朝上”的0.05%概率和②“‘老千硬币’连续投掷10次都出现正面朝上”的5.37%概率的合计值是5.42%。这就是在投掷硬币之前,“真正的硬币与‘老千硬币’的概率都为50%的情况下连续出现10次正面朝上的概率”这一假设的回答。

但是,“在硬币连续10次都出现正面朝上的情况下,硬币连续10次出现正面朝上的概率”必然为100%。这就好比提出“人类是人类的概率是多少”的问题一样,如果没有进行有哲学深度的思考直接做出回答的话,那结果一定是100%。

所以,“在硬币连续10次出现正面朝上的情况下,是真正硬币的概率”,在作为100%的5.42%之中只占0.05%,而“在硬币连续10次出现正面朝上的情况下,是‘老千硬币’的概率”则在5.43%之中占5.37%。

我们用①和②各自的值分别除以①与②的合计值5.42%。计算出“在硬币连续10次出现正面朝上的情况下,是真正硬币的概率”为:

①÷(①+②)=0.05÷5.42=0.90%

另一方面,“在硬币连续10次出现正面朝上的情况下,是‘老千硬币’的概率”为:

②÷(①+②)=5.37÷5.42=99.10%

由此可见,根据10次全部出现正面朝上的数据来进行计算的话,有99.1%的概率是“老千硬币”。这个根据事前概率和数据计算出来的概率被称为事后概率。

  • 版权声明:本篇文章(包括图片)来自网络,由程序自动采集,著作权(版权)归原作者所有,如有侵权联系我们删除,联系方式(QQ:452038415)。