拒绝忽悠,你需要贝叶斯直觉

我们不能违背概率法则,因为它可以捕捉到关于世界的真相。—特沃斯基和卡尼曼

这句话,来自研究人类理性的心理学家特沃斯基和卡尼曼。它被同是理性心理学家的斯坦诺维奇引用,印在《超越智商》第10章的开头。

关于如何捕捉世界的真相,他的一个方法是:贝叶斯公式。

上图的人物,是一位英国神父,他叫贝叶斯。他在统计学中大名鼎鼎,他身旁的贝叶斯公式,原先是他思考上帝是否存在的产物。结果,贝叶斯公式成为了统计专业人士必学的条件概率公式,在决策领域,生生不息,大行其道。

但是,如果不是做专业统计,生活中,为了遇事更理性,我们无需记住贝叶斯公式,拥有「贝叶斯直觉」即可。

因为,斯坦诺维奇说:

掌握贝叶斯思维,除了一些词汇规则以外,你不需要学习其他知识。正规的贝叶斯思统计肯定包含计算,但是,为了避免犯概率相关的思维错误,你只需掌握相关的概念性逻辑即可。

这些概念有两个,分别是「备择假设」和「基础概率」,不懂它们,容易被忽悠。

不太明白?且听我一一道来。

什么是「备择假设」?

在新冠病毒蔓延的今天,我们看看医疗案例,了解一下,如果医疗人员缺乏概率知识,那么,他们在救人治病时,是如何容易出错的。
斯坦诺维奇指出一种揪心的事实:医疗人员,由于缺少「贝叶斯直觉」,忽略「备择假设」,出现推理谬误——以为某种医疗方案有用。实际上,对患者不加干预,他们也会自愈。

让我们来看看一组医疗实验数据:

200人接受治疗,病情改善。
75人接受治疗,病情没有改善。
50人不接受治疗,病情改善。
15人不接受治疗,病情没有改善。

对此,不少人会注意到:200人治疗有效,75 人治疗无效。他们还认为「200」的数字远远大于「75」的数字,得出错误结论,认为治疗有效。
对另一组数据「不接受治疗」的数据,他们忽略掉了。

让我们慢下来,仔细算一下。

  • 治疗组的病情改善的概率是(200/200+75) = 0.7272
  • 不治疗组的病情改善的概率 (50/50+15) = 0.7692

虽然,咋一看是治疗方案有效,有效概率达到72%,但其实,在不治疗的情况下,有效概率更高,是76%。
看起来,病人比较可能是自愈的,不治疗也能变好。

他们忽视的对照组,也就是「不接受治疗」的情况,就是忽略了「备择假设」及其概率。

什么是「基础概率」?

再者,人们容易忽略「备择假设」,还会忘记「基础概率」。

在新冠病毒蔓延的今天,我们再看一个XYZ病毒的案例。

某种疾病,由XYZ病毒引起,在所有人口之中,它的发病率为0.1%(千分之一)。

假设:一种化验方法可以100%检测到XYZ病毒。
这种化验方法的假阳性为5%。
换句话说,如果一个人携带XYZ病毒,通过这种化验法,一定能查出,不会漏掉。
但是,如果健康人接受化验方法,也有5%的误诊概率,他会被误判为携带XYZ病毒。
问题:从人群中,随机选一人检测,化验结果为阳性(指的是此人携带 XYZ 病毒)。
那么,不考虑个人信息及病史,这位受检者携带 XYZ 病毒的概率是多少?

这一题,最常见的错误答案是 95%。正确答案是2%,此人携带 XYZ 病毒的概率极小。

因为,多数人过于依赖鲜活生动的个案内容,简单动脑算出1-5%=95%的错误答案,而忽略了基础概率。

我们从基础概率出发,做出如下推论:

1000人中,1人携带病毒,化验肯定是阳性。

999人不携带XYZ病毒,其中,化验为阳性的人数约50人。(结果等于人数乘以误诊率,999X5%=49.95)

所以,一共有51人是阳性。

最后,如果一个人是阳性,那么此人携带病毒的概率是:1/51=2/102。

结果有点「意外」,携带XYZ病毒的概率大约是2%。

什么是「贝叶斯直觉」?

类似的,斯坦诺维奇介绍了心理学家麦克多尔蒂研究的例子。我画了一张图,用来解释什么是「备择假设」及「基础概率」。

上图所写的「基础概率」和「备择假设」,就是拥有「贝叶斯直觉」思维的人,应该想到的。

对于非医疗专业人士而言,在日常生活中如何运用呢?

我举个例子,一个男生,在理工科的大学校园里,偶遇了一个女生。她穿着时髦,就像典型的艺术生那样。

根据这一见钟情的「眼缘」,应该在附近的什么地方等她呢?

是否应该在艺术生出没的地方,比如附近的排练房或者画室的门口,去等待她呢?

或者是,在附近,去理工科学生常常出没的实验室和图书馆去等她?

哪一个地方,更可能遇见她呢?

贝叶斯直觉,前来救援:

  • 基础概率,艺术生比非艺术生5:95。
  • 备择假设:看起来打扮时髦(焦点),也有「非艺术生」(备择假设),大概是10%。另外,还有20%的艺术女生,打扮时髦,「看起来」不像艺术生。

假设有校园里有10000个女生,艺术女生500个,那么有400(500X80%)个看起来像「艺术生」。而非艺术生的女生有9500个,其中约950(9500X10%)看起来像艺术生。

她是「非艺术生」的概率大约是(900/900+400) = 70.3%。

换句话说,在这个理工科院里,十个看起来像艺术生的,大概七个是非艺术生。她更可能是理工科的女生。

这个男生,还是去附近的图书馆和实验室等女神吧。

小结

所以,想要装上「贝叶斯直觉」的心智程序,我们在遇事时,先想两个条件:

  • 这件事的「基础概率」是多少?抛开具体鲜活的信息,我们先看看整体的概率?
  • 这件事的「备择假设」是多少?还有哪些原因,一开始没想到?哪些原因,别人故意没说,或者漏掉了?

黄建迪
2020/03/05

(版权声明: 本博客所有文章除特别声明外,均采用 CC BY-NC-SA 3.0 许可协议。转载请注明出处!)