吴仲义蒲慕明再次呼吁及时公开共享数据!(3)
目前的分析结果提示了几个重要的科学问题。最关键的是,“2019-nCoV是否在人群中持续的进化?” 如果这一问题的答案是否定的,病毒没有快速变异, 对于抵抗疫情是个定心丸。
从疫情刚开始至2020年2月早期,病毒的变化是相对缓慢的。出现在多例样本中(>=2)的氨基酸突变只有8个。
更重要的是,这些突变的分布与 “沉默”突变(没功能效应的突变)非常相似。这说明,2019-nCoV在传播的过程中没有发生剧烈的适应性变化,这与2002 年SARS病毒非常不同。
简单的说,2019-nCoV可能在野生动物与人之间已经“磨牙”好些时候了,现已进入适应性进化的迟缓期了。我们希望这个推测是对的。如果得到证明,也许可以缓解公众的不安。
隐现危机的可能性
虽然看起来病毒似乎进化迟缓,但是有一些信号不能掉以轻心。
首先, 大部分的氨基酸序列突变都出现在近期国外报道的数据中,隐示病毒也许正进化中。
其次,8个氨基酸序列突变是成簇出现的, 一个突变似乎促进另一个突变的发生。
第三,尤其需要警惕的是位于病毒ORF8基因中28144位点上的突变—— 在1月5日以前于武汉采集的13例样本中只出现了1次(7.8%),但在1月10日之后于武汉之外采集的42例样本中,出现了18次(43%)。
这样的跃变看起来很惊人,但样本数量不够大,统计学上未必可靠。我们需要更多的数据来查清楚这个突变是否是个危险讯号。
另一个突变,在55例样本中仅出现了五次:橙县(CA2/2020,美国)、巴黎(IDF0373, 0373/2020,法国)、高雄(2/2020,中国)、克莱顿(VIC01/2020,澳大利亚),但全部是在大陆境外。这也是值得密切关注的。
最坏的可能性是, 经历了两个月的“慢进化”模式之后,2019-nCoV“摸索”出了进化的途径,开始蠢蠢欲动。SARS病毒进化的第一阶段也恰好是两个月。
上面两个推测,不确定性都很高。因为样本数实在不够大。只有完整并及时地发布数据, 才有可能尘埃落定。
数据(不)公开的文化根源
数据共享与否背后有科学文化的不良背景。新发布的数据主要来自于国外而不是疫情严重的国内。关于测序数据是否应该公开发布和自由获取,在国内网络上颇有争论。根源在于如何保护研究贡献、影响知识产权。
更具体来讲,国内学术界对于所谓“高影响因子期刊”发表文章的强烈需求,远远超乎国际的惯例[4]。扣留数据其实也反映了国内论文发表的评价体系。一篇论文不管是在A期刊还是B期刊上发表,还是同一篇论文。
研究人员对“高分期刊”过度看重的不良风气, 在这次疫情里已显示不仅仅是学术圈内的问题了。扣留数据通常不会干扰社会的正常运行,但在当前的危急情形下, 影响会是严重而深远的。
的确,第一批发布病毒序列的论文阐明病毒有人传人的可能,但是没及时告知社会。未来回顾这次疫情,这几天的延迟可能是关键。
关于科研人员道义责任的几点提议
鉴于当前疫情的严峻形势,选择不公开病毒相关的数据是有悖科研道德的。应对数据发布,国内已经建立了一些开放数据库(例如https://bigd.big.ac.cn/,https://db.cngb.org,或开放数据分析平台(例如https://fight-sars2.genowis.com) 。
学术期刊,包括《国家科学评论》(National Science Review),应该采用“胡萝卜加大棒”的方式促进数据的发表。