贝叶斯定理:我们几乎每天都在使用的数学工具 - 范文中心

贝叶斯定理:我们几乎每天都在使用的数学工具

11/30

我们的世界观和因其导致的行为往往是由一个简单的定理促成的,在150多年前,这个定理由一位性格内向的英国数学家和神学家托马斯·贝叶斯(Thomas Bayes)悄悄设计,直到他去世后才将其发表。

贝叶斯定理最著名的运用之一是在二战期间被用来破解纳粹的恩尼格码密码。如今,该定理更是广泛深入的被运用在科学、技术、医学等领域。

但什么是贝叶斯定理?它又是如何运作的呢?

贝叶斯定理

托马斯·贝叶斯的洞察力非常简明。一个假设是真实的概率取决于两个标准:

根据当前的知识(“先验”),判断它的合理程度;

评估它与新的证据的契合程度。

然而,在贝叶斯去世后的100多年里,科学家通常仅通过对新的证据来评估他们提出的假设。这是我们大多数人在科学课上受到的传统的假设-检验(频率论者)方法的教育。 当一个不合理的解释与一个新的证据完美契合时,贝叶斯定理和频率论者的方法之间的区别尤为明显。

让我们先来制造一个假设:

“月亮是用奶酪做的!”

△一个不合理的假设。(图片来源:Mike Lee)

接着,我们仰望星空,并收集相关的新证据,并发现月亮的颜色是奶酪黄。在传统的假设-检验框架中,我们会得出新的证据与我们天马行空的假设相符的结论,从而增加了我们对该假设的信心。

△传统的假设-检验方法(频繁方法)只考虑一个假设与新证据的适合程度。(图片来源:Mike Lee)

但如果使用贝叶斯定理,就会得到更加谨慎的结论。我们会意识到虽然这个假设符合新的证据,但这个想法从一开始便极其荒唐,它违背了我们对宇宙学和矿物学所熟识的一切知识。因此,月球是奶酪的综合概率(即这两项评估的乘积)依旧是很低的。

△贝叶斯推理考虑了假设符合现有知识的程度以及它符合新证据的程度。为了简单起见,公式中省略了归一化常数。(图片来源:Mike Lee)

当然,这只是一个极端的例子。没有哪位正经科学家会试图检验这样一个荒诞的假设。 但是,全球科学家们总在不断评估大量的假设,而其中一些假设是相当牵强的。

例如,2010年有一项研究最初表明:

“持有温和政治观点的人可以看到更多的灰色。”

后来这个假设在进一步检验后被驳回,研究人员认识到这是不可信的。然而几乎可以肯定的是,有许多类似的研究已被草率的接受。

生活中的贝叶斯方法

运用先前的经验和记忆中积累的知识、和意识中提炼出的新证据,我们对日常事物的概率进行分配和生活进行管理。

举一个生活中的简单事件:接听手机。通常在工作时你将它放在办公桌上,而在家里时把它放在在充电器上。现在你在家里的小花园里浇花,听到屋内电话声响起。新的数据会告诉你它处于室内任何地方,但你仍会直接走向充电器。因为你将的先前对手机位置的认知(通常在办公桌上或家中的充电器上)与新的证据(房屋的某处)相结合,从而确定了它的位置。

如果手机不在充电器上,那么你会唤起先前你在某些放置过手机的位置的认知来缩小搜索范围。 你会忽略房子里大部分的地方,如冰箱、袜子抽屉等等,因为这些地方在你先前所积累的认知中被认定为极不可能的位置,你会在最终找到电话之前思考最可能的地方。

而在这个找电话的过程中,你便正在使用贝叶斯定理。

认知和证据

贝叶斯推理的一个特征是:当数据较弱时,那么先前对事物的认知是最重要的。这个原则一直被我们直觉性地使用。

例如,你在酒吧玩飞镖,附近的陌生人说他(她)是专业的飞镖选手,那么一开始你很可能会假设这个人在开玩笑。

你对这个陌生人一无所知,但你知道遇到一个真正的专业飞镖选手的几率很小。比如在澳大利亚,专业的飞镖选手只有大约15名。假如他扔了一只飞镖正中靶心,你可能还是不会相信他的说法,因为这可能只是走运的成分。但如果他连续十次都击中靶心,你会更倾向于接受他是专业人士的说法。因为随着新证据的积累,你之前的认知被超越。贝叶斯定理再次起到作用。

一个统管它们的理论

现在,贝叶斯推理支撑着广泛的人类调查领域,从癌症筛查到全球变暖,从遗传学到货币政策等等等等。

例如,贝叶斯推理是风险评估和保险行业的基础。每次飓风或洪水袭击一个地区时,保险费都会飞涨。为什么?

△ 飓风Debbie席卷澳大利亚昆洲,带来的强降雨将居民房屋包围在洪水中。(图片来源:Dan Peled/AAP Image)

量化风险是一件非常复杂的事情,而且目前的条件不足以对未来可能发生的灾难提供足够多的信息。因此,保险公司会根据现时情况并结合过往发生的情况来估算风险。每当自然灾害发生一次时,他们就对该地区的信息进行更新,预计未来索赔的可能性将更大,因此提高保险费。

在医学诊断中,贝叶斯推理也同样发挥着重要作用。一个症状(新证据)可以是多种可能的疾病(假设)的结果,但不同的疾病对于不同的人来说具有不同的先验概率。而在线医疗工具无法将个人的先验概率恰当的考虑在内,这也正是在线医疗的主要问题。它们对你的个人历史知之甚少,因此会忽略一系列可能的疾病。

贝叶斯定理再次告诉我们:向一位了解你之前病史的医生求诊,能获得更高效合理的诊断。

阿兰·图灵和恩尼格码

贝叶斯方法能让我们从模糊的数据中提取准确的信息,从无限可能性的范围中找出更有针对性的解决方案。

这也是阿兰·图灵当年破解德国恩尼格码的核心,它加速了二战的结束,挽救了数百万人的生命,对全世界都意义非凡。若是要在无数的潜在翻译下进行搜索是不可能破译一组加密的德文信息的,尤其是恩尼格码通过不同的转子设置每天变化。

图灵关键的贝叶斯洞察力是一些特定信息比其他信息更有可能,这些可能的解决方案都是基于以前的成功破译的信息和符合逻辑的期望。例如,德国的U型潜艇的信息可能包含与天气或盟军航运相关的短语。

类似这样的先验信息极大地缩小了可能需要评估的翻译数量,使得图灵的密码破译机能以超过日常变化的速度快速破解恩尼格码。

△密码学家用来破解德语恩尼格码的解码机“炸弹”的重建的复制品。(图片来源:Ted Coles/Wikimedia)


相关内容

  • 概率论发展史
    17世纪,正当研究必然性事件的数理关系获得较大发展的时候,一个研究偶然事件数量关系的数学分支开始出现,这就是概率论. 早在16世纪,赌博中的偶然现象就开始引起人们的注意.数学家卡丹诺(Cardano)首先觉察到,赌博输赢虽然是偶然的,但较大 ...
  • 医科类本科数学基础课程教学基本要求
    高等学校理工科 教学指导委员会通讯 2006年第4期(总第35期) 2006年4月 医科类本科数学基础课程教学基本要求 数学与统计学教学指导委员会 一.前 言 数学是研究客观世界数量关系和空间形式的科学.它不仅是一种工具,而且是一种思维模式 ...
  • 小善推荐| 巴菲特的好基友怎么看投资?读读[查理·芒格的智慧]
    <查理·芒格的智慧>这本书介绍了巴菲特的好基友--查理·芒格的投资格栅理论,作者是美国人罗伯特G·哈格斯特朗(这个大叔写了一系列关于芒格和巴菲特的书). 什么是投资格栅理论呢?芒格提倡的格栅理论意思是多学科融会贯通,不要只是圈在 ...
  • 复变函数论文
    复变函数的精确之美 --学习复变的感想 对于理科类学科的学习而言,最重要的一点莫过于概念的清晰程度.因为所有的推导.证明以及应用,归根结底都是在基本概念的基础上衍生而来的.因此只有将相关概念真正理解同时牢记于心,才可以真正地走进一门学科,真 ...
  • A3精算模型
    A3精算模型 考试时间:3小时 考试形式:选择题 考试要求: 本科目是关于精算建模方面的课程.通过本科目的学习,考生应该掌握以概率统计为研究工具对保险经营中的损失风险和经营风险进行定量地刻画,并建立精算模型的方法,进而要求考生掌握模型参数估 ...
  • 贝叶斯网络
    贝氏网络 维基百科,自由的百科全书 (重定向自贝叶斯网络) 贝氏网络(Bayesian network),又称信任网络(belief network)或是有向非循环图形模 型(directed acyclic graphical model ...
  • 20**年东北大学机械考研400+经验分享
    合理的坚持就是胜利 --记2014东北大学机械工程考研 政治:70+,英语二:70+ 数学二:125+,专业课:130+,总分:400+ 考上我心中理想的学校与理想的专业,一切都几乎完美的不真实,但自己从来不算个优秀的学生,本科没拿过一次奖 ...
  • 数学猜想-全世界能攻的不超100人
    文汇报/2012年/5月/24日/第00A 版 文汇教育 数学猜想, 全世界能攻的不超100人 数学猜想--对于大多数人来说,意味着神秘浪漫,高深莫测. 破解数学猜想之人,从来也散发着深不可测的气息. 不久前,中南大学22岁的本科生刘路因为 ...
  • 概率在生活中的应用
    概率在生活中的应用 1409025 金哲明 机械一班 概率论在一定的社会条件下,通过人类的社会实践和生产活动发展起来,被广泛应用于各个领域,在国民经济的生产和生活中起着重要的作用.正如英国逻辑学家和经济学家杰文斯(Jevons,1835-1 ...
  • 拉格朗日中值定理的新证明
    第!&卷第%期 沈阳师范大学学报 (自然科学版) ,$%&/!&'%/%.12+! ! 文章编号:()& 拉格朗日中值定理的新证明 孟宪吉,王 瑾 (沈阳师范大学数学与系统科学学院,辽宁沈阳&)&am ...