查看原文
其他

[后台点播]论,粉饰太平的艺术(评丹麦某儿童Long COVID论文)

拍老师 拍照稀烂的焦虑怪 2022-03-14

前言

各位老铁你们好~本来昨天预告得好好的,今天咱来八卦Omicron的最新战报~但奈何计划不如变化快。就在刚才,后台又有朋友发来黑料,希望咱批判批判。打开一看,我的妈耶~躺平党们又闹出幺蛾子了。

这次是丹麦那边关于儿童Long COVID的最新论文,
刚刚发出来不到24小时,中文媒体这边就开始大肆推介了~
那么咱就来扒一扒,这篇看起来充满希望的伪定心丸,到底是如何粉饰太平的。





❷ 划胖的Abstract


今天临时换的选题,
之前完全没预热,
完全是想到哪儿喷到哪儿,
主要也是黑点太多了,
简直张嘴就能喷,
所以咱先从Abstract开始呗~
here we go!

——请品鉴:

标题:

新冠病毒阳性儿童的Long COVID症状与持续时间研究——一次全国性队列研究
简而言之,
这玩意儿是丹麦阿尔豪斯大学和隔壁某医院儿科一起合作搞的研究,
他们在2021年3月19日到5月24日期间,
在丹麦全国范围内发了十万份左右电子调查问卷,
然后靠着收到的回应一顿骚操作,
最后糊弄出来了这么一份paper~
但咱第一眼看到这Abstract吧,
一股子划胖的气息就扑面而来……

——具体而言,请品鉴啊:

红框部分翻译成人话:

这是一个阳性组人数高达37522人的队列研究! 

对照组更是有78037人之多!

3.7万+7.8万,这都十万出头了~
这规模看起来真不小啊老铁!
所以咯,不出所料,
躺平党们拿这篇论文作妖的时候,
纷纷拿这个规模当卖点~

——比如说,请品鉴:

↑ 已连续感染三次(或四次)新冠(但自称只感染了两次),
嗅觉已(疑似永久)失灵,
但仍坚持躺平不动摇的Balloux老师表示:

这是全球第一份入组人数超过10万的大规模儿童Long Covid研究!


——再比如说,中文版请品鉴:


然而……
实际情况确是……
一图秒懂啊!

——请忍笑品鉴:

这尼玛,
划胖界的一朵奇葩啊这可以说是!
发出去10万份问卷,
还尼玛是电子问卷
你就敢到处吹研究规模10万人,
还有这种骚操作的吗???



这就好比……
如果拍老师我中年,生活无着,
不得不去超市门口发传单糊口……
只要每发出去一份都给算计件工资的话呢,
那么咱倒可以说,
传单发得越多越好,
如果能发出去十万份的话,
那就简直算是光宗耀祖了……

可是你们恬着脸自称这是“全国性队列研究”啊,
你们也好意思自降身份玩儿发传单的骚套路???

——请品鉴:


各位,你们可别怪咱吹毛求疵啊(严肃脸)~
这玩意儿它既然是一份retrospective cohort sutdy(回顾性队列研究),
那就意味着,搞研究的前提条件就是把队列给划分清楚~
或者用人话来说就是:
至少咱得先有病例组和对照组是吧?
所以只有分好组之后,
才有讨论人数规模的意义~
而在没走完分组流程之前,
所有数字都只是浮云而已。
这就是为啥咱一开局就说,
这尼玛论文是垃圾:
开局二话不说就拿发传单数量冒充入组数量来划胖,
你们实验设计课老师的棺材板都快按不住了!




❸ 灾难现场式问卷设计


如果说Abstract划胖还能勉强解释为宣传需要的话,
么接下来各位将看到的这部分,
就只能用恶意欺骗来解读了。
为啥这么说呢?

各位你们想必还记得,
今天咱品鉴的,
这是一份基于电子问卷调查的队列研究,
所以可想而知,
决定研究质量的重中之重,
就是问卷设计一定要合理。
可是这份研究吧,
问卷设计堪称一场学术灾难现场~

——两图秒懂,请品鉴:

???
???

各位看看红框部分……

劳资可信了尼玛的邪呢吧!


所以阳性组的症状统计期间是4 weeks or more after his/her positive corona test
翻译成人话就是,所有症状从“新冠检测阳性后四周或更久”开始计算;

而阴性组的症状统计期间则是“within the last year”,
翻译成人话就是“过去一年之内”的症状全都算数。



咱举个极端一点的例子吧:
现在假设拍老师我是丹麦一枚17岁花季少年,
我课余时间勤工俭学发传单不幸中招,
在2021年2月20日那天检出新冠阳性。
然后我在2021年3月19日收到一份神秘的电子调查问卷,
问我在阳性4周之后有没有出现一堆症状……
于是我掐指一算,
这份问卷调查给我留的发病窗口期只有:
3月19日-2月20日-4周=1天

现在我的同桌Muhammad也收到了对照组版本问卷,
只见他打开平板,
对着我邪魅一笑:

WITHIN THE LAST YEAR哦!哈比比!

而且啊,各位,
上述问题只是这份灾难现场式调查问卷最明显的硬伤罢了,
但远远不是唯一的硬伤。

其他一眼就看得出来的问题还包括:
  • 新冠阳性状态全靠问卷调查来确定(所以完全不能控制对照组里面有没有混入没检出的阳性者);

  • 阳性组问卷没有确认对应症状是不是和某种已知慢性病相关(如果相关的话理应排除掉);

  • “注意力不集中”这种认知症状……尼玛直接靠远程问卷调查来统计?丹麦人干活儿可以这么糙的吗???


所以咯,各位应该已经看出来了,

归根结底吧,这个队列研究的问卷设计,


它其实就是在明目张胆地拉偏架:

  • 一边是PCR检测阳性儿童,在确诊之后四周开始算的症状;

  • 而另外一边则是没被PCR检出阳性(但仍然有可能阳性)的儿童,在过去整整一年时间里的症状(并且有可能跟其他已知慢性病相关)。






❹ 关于Long Covid症状的迷思


上文说到拉偏架,
那么拉完偏架之后的结果是啥呢?

——请先品鉴一眼:

总之,上面是一堆各种各样的独立症状,
以中间那条黑线为界,
每种症状对应的小横线越靠右,
则代表新冠阳性组的发病风险越高;
而如果小横线出现在黑线左边,
则相当于阴性对照组的发病风险反而更高。

比如咳嗽/发烧/注意力不集中这类非特异症状吧,
就算咱姑且认为新冠病毒既往感染史完全不会增加发病风险,
那么结果最多也就是两边打平手对吧?
可是这拉偏架拉的……
发病风险比直接横跳到黑线左边去了都……
也就是说对照组发病率反而比新冠组更高……
这尼玛是啥情况?
同时,更糟心的是,
嗅觉丧失/味觉丧失这种众所周知特异性更高的症状呢,
则是拉偏架都拉不住,
直接朝着右边爆表的趋势狂奔……

口说无凭,咱还是来看图得了。
话说有大佬路见不平,
根据论文数据另外做了几张图,
(剑桥大学Ziauddeen老师威武!)
于是情况一下子就变得直观起来了……

——两图秒懂,请品鉴:

↑ 如上所示啊,
一眼看得出来,
新冠阳性组跟对照组,
在不同症状上的发病率造型迥异(这里咱暂且不提拉偏架这一茬),

结果阿尔豪斯大学的老师们,
他们居然……
他们居然就这样直接把这些造型迥异的发病率揉在一起
然后得出一个超级醒目的结论!

——请品鉴:

安啦!新冠阳性组的Long Covid症状只比对照组高0.8%而已啦!

这就差不多相当于在说:

马爸爸资产500亿,

拍老师辛辛苦苦发传单,资产500块。

现在把两边的资产揉在一起,

人均250亿!

惊不惊喜意不意外?


所以阿尔豪斯大学的老师们为啥不敢把两边数据分开说呢?

就比如说这样的:

新冠组出现嗅觉丧失的比例高达10.31%(其中17岁年龄段更是高达28%),

四舍五入就是对照组的100倍

以及这样的:

对照组出现咳嗽的比例高达6.68%(其中1岁年龄段更是高达20%),

四舍五入就是新冠阳性组的2.5


而且吧,

就算使出了“我和马爸爸平均资产上百亿”这种大招,

其实还是直接没法得出“新冠阳性组的Long Covid症状只比对照组高0.8%”这样的安心结论……

不信的话各位自行打开论文原文,

掰着手指数一数阳性组和对照组的症状占比,

反正咱数出来是这样一个造型……


——请品鉴(再次感谢剑桥Ziauddeen老师提供灵感):

↑ 25.71%-22.62%=3.09%
应该没算错吧?

么这神秘的0.8%到底是哪儿来的?
于是咱又强忍着不快,
第三次通读了原文,
然后在某个不起眼的角落里发现了端倪……

——请品鉴:

???
???
所以第一页最醒目的地方说得好好的:

0.8% of SARS-CoV-2 positive children 

到了正文里头却暗搓搓地变成了:

Within the age group 6–17 years, 0.8% more SARS-CoV-2 positive children……


这尼玛是明摆着欺负大多数混子刷论文只看Abstract对吧

好了各位,
上面嬉笑怒骂了不少篇幅,
现在咱又要转换成严肃脸,
说点认真的东西~

这篇论文吧,
除了明目张胆地划胖、标题党和拉偏架之外,
最核心的问题,其实是方法论上面的瑕疵~
而且严格来说,
有类似毛病的还不止今天这一篇。

具体而言,
这篇论文它就不能算是关于Long Covid的研究,
以至于全文上下居然没有一个地方给“Long Covid”下过明确定义……
这你们敢信?
所以这玩意儿吧,
它充其量只能算是统计某些Long Covid相关单独症状相对发病率的研究而已。

所以现在问题就来了啊:

到底啥是Long Covid?
或者说,
能不能用一堆相关性或强或弱的独立症状去代表Long Covid?

用大白话来解释就是说,
Long Covid的原理和机制,
直到现在都还没研究清楚,
现如今所有关于Long Covid的描述和研究,
其实针对的都是特定症状和病征。
在这一前提下,
Long Covid当前最适合的定位,
可能应该算是一种综合征(syndrome)~

——名词解释顺便走一个:

而对于综合征而言,
最重要的也许应该是搞清楚某些特定症候共同出现的规律,
而不是把个别症状挑出来,
然后和对照组单挑(顺便拉拉偏架),
再把各个捉对单挑的发病风险比汇总起来,
挑挑拣拣,
最后得到一个0.8%的粉饰太平的理想数字……

就比如说吧,
假设咱打算研究肾病综合征,
然后咱把眼皮浮肿、下肢肿胀、体重增加、疲倦、食欲不振以及嘘嘘时泡沫变多等等各种症状单独拉出去跟莫名其妙的对照组PK……
信不信试验设计课的老师会把屎都格老子打出来

并且会被试验设计课老师打出屎的,
也许还不止拆分综合征这样一种骚操作……
上边咱略微提到一嘴的,
靠着远程问卷调查确认“注意力不集中”这类认知症状发病率,
可能也是一个让人迷惑的骚操作……
但篇幅实在有限,
并且咱对这一块儿其实也不太懂,
就不深入讨论了。



最后再怼一怼勤劳的搬运工


另外一个让人百思不得其解的问题在于,
这篇论文如此拉胯,
以至于咱这样一个完全领域无关的焦虑贩子都能挑出一堆刺,
那么各位急匆匆搬运“好消息”的专家大佬们,
是偶尔一时眼拙呢?
还是打算跟着丹麦人一起粉饰太平呢?

——比如说这样的:


——再比如说这样的:

摊手~

您可能也对以下帖子感兴趣

文章有问题?点此查看未经处理的缓存