对于这些 “疑似病例” 的情况问询,辉瑞于1月15日邮件回复《知识分子》,但并未回答具体问题,其回复如下:
● ● ●
最近英国医学杂志(BMJ )的编辑彼得·多西(Peter Doshi)质疑新冠疫苗有效性数据的文章引起了很大争议。里面最引人关注的一点是关于辉瑞新冠疫苗三期临床试验里的3410例 “疑似” 病例的处理。这三千多人出现了试验中定义的疑似新冠症状,但没有阳性的新冠核酸测试结果。根据辉瑞的试验流程,这些人不算新冠,自然也没有作为感染病例纳入疫苗有效性的计算。
多西认为,这些人即便核酸测试阴性,也不能排除是假阴性的可能。他做了比较极端的假设,说这些人应该全当新冠感染处理,这样一算,疫苗有效性就只有19%或29%了(两个计算结果的区别在于是否只记录接种了第二针疫苗后的第7天开始的病例数)。
《知识分子》上的几位专家也就辉瑞的疑似病例做了讨论。有位专家认为传染病要从症状出发,这些疑似病例既然有症状就不能轻易排除可能是新冠感染者。另外一位则认为这些疑似病例没有阳性的核酸测试,可能是因为没有测核酸,自然也不能排除。当然,至于像多西那么极端的全算成感染,几位专家也认为不合适。
我认为几位专家的看法欠妥。因为在讨论辉瑞临床试验里的疑似病例时,我们不能脱离临床试验的特定标准。像辉瑞试验里的疑似病例,和医疗诊断里的疑似病例不是一个概念。在核酸检测上,临床试验里也有明确的规范。仔细分析不难发现,这些排除在外的疑似案例很可能就是没有感染新冠的虚惊一场。
辉瑞/BioNTech疫苗临床试验里的疑似病例到底是怎么来的?
探讨临床试验里的三千多例疑似病例该不该计入新冠感染的范畴,我们先要看辉瑞/BioNTech在试验中是如何确诊新冠的。
在他们的三期临床试验中,新冠感染的确诊是先用症状来“撒网”,再用核酸测试来确认的模式。具体的标准如下:
2. 在症状出现后(直至症状消失的4天内)做核酸检测并检测为阳性。(注意符合标准1的都会被要求测核酸,测试的方式包括到医疗机构测或者邮寄鼻咽拭子给受试人,由受试人自己采样后寄回样品)。
符合这两项标准的,才被记录为新冠感染事件。也就是说,辉瑞/BioNTech疫苗的临床试验,95%的有效性分析(在明确无过往新冠感染史的人群接种完第二针疫苗一周后开始记录)是基于有症状的新冠核酸阳性受试人。而那些符合1里的症状标准,却没有阳性核酸测试结果的人就成了疑似病例。
疑似病例是否存在未检测核酸的情况?
在多西的文章中,作者对于排除疑似病例的不满是基于对核酸测试灵敏度的怀疑。那万一核酸检测不够灵敏,明明是感染没测出来怎么办?需要注意的是,多西是认为这三千多疑似病例是做了核酸检测的,只不过结果是阴性。
《知识分子》的专家中则有认为这些疑似病例可能是没做核酸检测的情况,相当于是认为辉瑞/BioNTech在临床试验里出现了 “因为没查是不是新冠,所以就不是新冠” 的情况。
在这一点上,个人认为这些疑似病例应该是查了核酸,结果是阴性,而不是没做核酸检测。原因如下:
辉瑞/BioNTech的临床试验操作细则对于出现症状的受试者接受核酸测试有非常明确的要求。出现症状后的核酸测试是 “潜在的新冠随访”(Potential COVID-19 Illness Visit)的一部分。如果受试人没有按要求做核酸检测,在归类上属于没有完成试验设计中的 “新冠随访”,是 “数据缺失”(missing data),不能假定为核酸测试阴性,归入疑似病例。辉瑞/BioNTech的临床试验设计中也明确说了,在有效性(试验一级终点,也就是试验的首要验证目标)的计算中,缺失的实验结果不会通过 “估算” 来输入 [2]。
此外,FDA的资料中详细描述了两例症状严重的疑似病例,其中明确提到了核酸检测阴性,其中一例还在住院期间做了多次核酸测试。
综合这些,我认为这三千多例疑似病例属于出现了症状,但通过核酸检测排除了新冠的情况。当然,试验中所用核酸检测灵敏度,特别是受试者自己采样情况下的实际灵敏度值得探讨。这些或许在药企与监管机构(如FDA)的申报过程中就已经详细论证过,但由于新冠疫苗的公众关注度极高,相关单位若能提供第一手的信息,对于减少疫苗怀疑论的影响将大有意义。
排除核酸阴性的疑似病例是否合理?
在有症状的情况下,能否仅靠核酸阴性来排除新冠?这可能是国人非常敏感的问题。因为在去年武汉疫情高峰时,我们有过用CT影像而不是核酸测试来确诊新冠的情况。我们印象深刻的是,一些病人可能都病得很厉害了,核酸还是测不好。
必须要说明的是,用CT来确诊是有着特殊背景的。武汉是最早受到新冠疫情冲击的地方,当时我们对新冠的认识处在初级阶段,核酸试剂开发出来没多久,数量有限,什么样的单位有资质做核酸测试有比较多的限制,不同试剂在灵敏度等参数上也层次不齐。在这些因素的共同作用下,出现了核酸测试要等很久或测试效果不好的情况。在这一大背景下,才采用了对于CT影像特征明显的病人,通过影像而非核酸确诊的手段。即便如此,CT影像也只是一种补充,核酸测试一直是确认新冠感染的金标准,这一点没有变过。
回到辉瑞/BioNTech临床试验里的情况。2020年7月底,三期临床试验开始时,新冠核酸试剂的研发生产已经很稳定了。现在经常能查出无症状感染者,就是完全依赖核酸试剂的高灵敏度来筛查的。如果按多西原文的理解,三千多例疑似全是由于核酸测试假阴性,那核酸测试的灵敏度连5%都不到(170例确诊阳性,3410例阴性计算而得),显然不符事实。
其次,辉瑞/BioNTech临床试验里的新冠症状筛查标准,不是医疗实践里的判断一个病人是否得新冠的医学标准。辉瑞/BioNTech采用的疑似标准是非常宽泛的症状标准,而且出现任何一个症状就算。不说别的感冒、流感这些呼吸道传染病会符合它们的症状标准。别的非呼吸道疾病都会有,甚至不用生病就是偶然身体不太舒服都可能有。这些症状还可以是很轻微的,像发烧,都没有说多少度才算。
基本上,受试者一不舒服就可以去测核酸。由于受试者要做电子日记,还有试验工作人员的随访,受试者也不容易忽略自己的症状。其检测标准比一般生活中由医生判断为疑似病例去做核酸测试的标准低非常多。为什么它们定那么低的标准?因为功利地讲,试验进度是由确诊感染数来驱动的,新冠确诊越早越快,试验就能尽早完成,药厂巴不得早测、多测出几个。他们是怕症状要求太多,漏了没去测的,不在意症状要求太低,白白测了很多人。
由于临床试验里的疑似新冠有这样特殊的标准,所以这三千多疑似,不能认为属于明显像新冠的案例,加上核酸检测还是阴性,自然不能当新冠感染来分析。实际上,在三千多例疑似中,只有两例属于症状严重的。都发生都在疫苗组,其中一例是接种第二针疫苗后开始出现症状,三天后住院做核酸检测是阴性,CT发现肺部正常,住院两天后康复出院了。虽说不能排除一次核酸检测的假阴性,但肺部CT正常,也可能是疫苗的不良反应(考虑到症状在接种后的7天内出现并消退,个人觉得这个可能性更大些)或其它疾病。另一例则是出现了肺部CT异常,但这人做过多次核酸检测,都是阴性,这种情况下,碰上其他感染的可能性远高于新冠——毕竟连续多次检测都是假阴性的概率会非常低。
有人可能会想,既然都不是新冠,还分析这些疑似病例干啥。其实FDA与药厂分析这些病例的时候是从不良反应的角度出发的。在核酸检测阴性的情况下,这些症状属于接种疫苗或安慰剂后的不良反应的概率,远大于核酸检测假阴性的概率。对于严重病例,更是要搞清楚是不是由疫苗引起的不良反应。
从感染率角度看,把这三千多例疑似算做新冠也并不符合常识。辉瑞整个试验的入组人数是4.4万人,平均的跟踪时间两个多月,3410例疑似都算作新冠,加上确诊的不到200例,就是说在两三个月的时间里,参与试验的人超过8%得了新冠。这个感染率可能吗?如果两三个月有近10%的人感染,美国也不用研发或推广疫苗了,因为过个大半年就达成群体免疫了。
实际上,如果我们去分析安慰剂组(可以看作是在美国人群里的一个抽样)的确诊病例数,试验期间的感染率(1.3%)和同时期(2020年8月到11月上旬)美国的感染率(3.3亿总人口中出现约6百万新增感染)是比较一致的(注:在原始试验设计中,假设的是美国的年感染率1.3%,预计半年达到设计的160例感染,实际由于自秋天感染率激增,也使得试验不到4个月就达到了设计收集病例数)。这些都证明临床试验里辉瑞/BioNTech的疑似病例处置没有问题。
多西关于疑似病例的质疑并没有充足的科学依据,仍能引起如此大的关注,很关键的一点就是在多个新冠疫苗的临床试验结果公布,疫苗进入部署阶段的今天,普通大众很关心一个问题,就是这疫苗到底多有效。比如,我们看到辉瑞/BioNTech说他们的疫苗有效性95%,不少人会想,能有那么好吗?我们看到科兴在巴西的疫苗试验有效性从78%变到了50%,会想这还有用吗?才几天就能有这么大的变化,我们还能当真吗?
在谈论临床试验里的有效性数据时,我们不能只看一个有效性的数字,得从统计学的角度分析。比如,辉瑞/BioNTech的有效性95%,是真的吗?有多靠谱啊?用起来不会没那么好啊?95%确实只是一个三期临床试验里观察到的结果。就像拿尺子去量一件物品的尺寸,量出来的 “尺寸” 和真实尺寸总是会有误差,在试验中观察到的有效性也不是绝对的。这些有效性有多靠谱呢?可以去看看试验置信区间下的有效性范围。像辉瑞/BioNTech的疫苗,临床试验95%置信区间内有效性为90.3%-97.6%。就是说,即便重复无数次这样的大规模三期临床试验,95%的情况下算出来的有效性都会在90.3%-97.6%里。从公众关心的角度去解释,大概率,这个疫苗有效性会在90.3-97.6%这个范围里。
科兴的新冠疫苗在巴西临床试验,最终的有效性是50.4%。一些人说这是踩着50%的标准线,另一些人这个数据不要紧,重症的保护率是100%。各说各的,怎么办?还是要把与这些数据相关的统计学分析拿出来。比如重症,确实在巴西将近一万人的临床试验里,7例重症全在安慰剂组,没有一例在疫苗组。但这个100%无重症的p值是0.49,就是说有差不多有一半的概率,我们看到所谓重症保护效果是不真实的,只是随机出现了这样一个7例全在对照组的分布。这意味着该结果并不可靠,很可能不具备可重复性。这是由于我们观察到的重症人数太少,没法下结论。
因此,我们不能说这个疫苗100%预防重症,这是不科学的,只能说有一点趋势。这种不具备显著性的趋势也不该是主要的宣传方向,还是要重点看在统计上达到显著性的数据。比如有效性50.4%,是把所有在试验里查到的感染都计算在内的,在统计上有显著性(p=0.0049),而在95%的置信区间里,有效性的范围在32.26-61.98%。
这个数据区间部分低于50%的红线,但我们不必太纠结于红线。从这个数据可以看出,科兴的灭活疫苗确实有一定的保护作用,没有像辉瑞/BioNTech或Moderna两家的疫苗那么高的有效性,但只要证实有用,就有帮助我们控制疫情的潜力。流感疫苗的有效性哪年达到40%都算是碰天花板了,一样在医疗实践中起着巨大作用。
而且这还只是一个开始,说不定随着后续研究的进行,疫苗有效性还会有提升的空间。从现有试验数据来说,巴西的临床试验入组人数仍然不是特别多,不到一万人,置信区间内的有效性范围也很大(32%-62%)。几个灭活疫苗都在多个国家地区进行临床试验,等有更多数据,或许可以提高结果的确定性。
按现有数据,几个灭活疫苗的有效性确实不如两个mRNA疫苗,但这不意味着我们要重新做疫苗。有时候一些简单的改进就可以提升现有疫苗的有效性。我们可以去做更细致的比较研究,比如是不是刺激产生的抗体滴度上有差距,是否可以想办法改进:比如是不是在剂量上再做些优化?甚至更简单一点,是否可以研究一下两次接种的间隔时间?一般来说间隔时间长一点,对于最终的免疫系统刺激会更好。当然,过长的间隔时间意味着中间有段时间没有免疫保护,但考虑到目前国内疫情风险低,这些是值得探索的。
新冠疫苗的研发不是零和游戏。即使国内灭活疫苗的有效性暂时还不如国外的一些疫苗,也没必要把它看成输赢问题。两个mRNA疫苗90%以上的有效性,证明了新冠疫苗的潜力或者说天花板是非常高的,通过疫苗这个工具来激发我们人体的免疫系统,我们可以非常有效地抑制疫情。证明这一点是对全世界的贡献。我们要做的是实事求是地去研究分析,争取把我们的疫苗也最优化。而在这一过程中,我们也要尽量秉持数据公开透明,这样才能让公众相信疫苗的潜力。
参考文献:
0
推荐