查看原文
其他

渡十娘|打了疫苗仍然确诊?辛普森悖论之疫苗效

渡十娘 2022-06-20

The following article is from 万精油 Author 万精油

做公众号里的《纽约客》

戳蓝字一键关注 渡十娘

转发也是一种肯定



文字|万精油

编辑|渡十娘



作者简介:万精油


非主流数学家。



辛普森悖论说,当样品中各子集分布严重不均时,子集与整体可能得出完全相反的结论。
 
样品空间中分布严重不均的情况很少,辛普森悖论引起的现象不是经常发生。一旦发生,则对一般大众有相当的迷惑性。比如最近麻州Cape Cod 的新冠小爆发案例。
 
Cape Cod 在独立节有一个大型集会,差不多6万人参加,后来据说有近千人感染。


 
上图是与这件事相关的报道。重要数字是,这次小爆发所感染的麻州居民中,有四分之三是打过疫苗的。这个结论使得一些人开始恐慌,甚至传言说疫苗对新变种无效,甚至更糟。
 
实际情况怎样呢?麻州的疫苗普及率在全美属于先进行列,成年人中已经70%+,老人中更是80%+。而这次聚会所在地Provincetown 又是麻州中最先进的镇, 疫苗普及率高达95% (下图)。

 

 

另外,这篇文章的题头图右面那个弯臂顶端就是Provincetown, 可以看到它是深蓝色,95% 疫苗普及率。

 

打过疫苗的是95%,那么没打过疫苗的只有5%,这就是典型的辛普森悖论所产生的样品空间,分布严重不均。在这个背景下我们再来看这四分之三说明什么问题。

 

假设新变种在这次聚会中对打过疫苗的人感染率是RV (Rate in Vaccinated ),在没打过疫苗的人群中感染率是RN (Rate in Non-vaccinated )。那么,打过疫苗被感染的人与总数是:本镇参加聚会的人数x 95% x RV , 没打过疫苗被感染的总数是 本镇参加聚会的人数 x 5% x RN。现在知道,本镇所有感染者中,打过疫苗的人占四分之三,也就是说打过疫苗的被感染总数是没打过疫苗的总数的三倍。也就是说

 

95% x RV = 3*5% x RN

 

由此可以推出:

 

RN/RV = 95/(3x5) = 19/3

 

没打过疫苗的感染率是打过疫苗的人的感染率的6倍多。把这些数据带入疫苗有效率计算公式,我们得出,疫苗有效率是

 

(19-3)/19 = 84%

 

实际上四分之三只是一个大致估计,我看到更准确的数据是,感染群中打过疫苗的是74%(大约等于3/4)。把这个数字带进公式,我们可以得出疫苗有效率是85%.

 

换句话说,只占总数5%(=1/20)的人感染人数却达到总感染数的1/4,恰好说明没打疫苗更容易被感染。

 

这本来是可以用来说明疫苗有效性的例子却被一些人拿来说疫苗无效,都是辛普森悖论惹的祸。专门写这个短文给被忽悠的人说明一下。我们经常讲要提倡数学思维。所谓数学思维,并不是一定要解决具体数学题目,而是要懂得对生活中的事情从数学的角度去思考。


 

---------------------------------

 

下面附注回答一些细节问题:

 

注1:有人提出,被感染的人不全是本地人,只用该镇居民的疫苗普及率是否合适。这个思维比较严谨,我写文章的时候也有这样的考虑。不过,那个四分之三就是从该镇居民中的感染人得出的结论,我推出的结论对应此说法,没问题。全体感染人来自全国各地,疫苗率没法决定。不过,根据我们的理解,一般外出旅游的人都是打过疫苗的,没打疫苗的人都呆在家里不外出,所以,这个疫苗普及率不会差太多。

 

注2:经典的辛普森悖论,小组与整体讨论的都是同一个概率,而我们这里的例子,一个是打疫苗的人在感染人中的比例,一个是疫苗有效率,严格的说不属于经典的辛普森悖论。不过,两者都是因为样品空间分布严重不均造成的歧义,算是广义的辛普森悖论。





你是我的阅读者 我做你的渡十娘

2020,我们一起走过的日子




昨日更新:

热文链接:


其他:

读完请点"在看"让更多人看到








图片 I 网络

整理 I 编辑 I 渡十娘

清单内容来自 I 万精油

版权归原作者 I 如有侵权 I 请联系删除



生活中

总有些东西值得分享



·十·娘

DES



IGN


发现 I 家庭 I 乐趣


想每天与渡十娘亲密接触吗?

喜欢?粉她!

有话想说:

海外:dushiniang999@gmail.com
国内:dushiniang999@126.com 


您可能也对以下帖子感兴趣

文章有问题?点此查看未经处理的缓存