捉“毒”,大数据显威力!
捉“毒”,大数据显威力!
真实世界永远比我们想象得更出人意料。
研究显示,零号新型冠状病毒肺炎患者其实与华南市场并无直接关联。那么,他通过何种渠道感染病毒目前无从得知。零号患者体内的病毒是否直接来源于野生动物或者野生动物的排泄物,还是另一个隐身于茫茫人海中的病毒感染者?
目前,不得而知。
确定病原体的重要性
既然已经知道了病毒,为何科学家还执着地寻找源头?面对《中国科学报》的采访,香港大学公共卫生学院教授朱华晨表示,确定来源才可以从源头和根本上切断传播链,避免病原的再次引入和再次暴发。
而确定病原体的来源需要做一系列的系统工作。首先是根据流行病学关联,找到患者可能接触、暴露的现场,采集各类与病原体可能有关的标本,看是否能检到类似病原体。
如果找到阳性病原体后,需要继续向上追溯其来源,包括产地、运输过程可能接触、暴露的地方。然后把所有病原体全部测序,根据序列的纵向进化和横向亲缘关系来推断病原体在不同宿主中传播的来龙去脉。
新冠病毒早已经被证实了人传人,是否可能存在人传动物,朱华晨认为,也有可能,但无证据。但目前传染源都还没搞清,这些就更不可能清楚了。但如果真的可以人传动物,单纯隔离人类的措施对疫情是否完全可控,朱华晨表示,仍有待商榷。
基于基因组大数据的防控策略
虽然寻找新型冠状病毒病原体的工作仍在继续,但借助二代测序技术对该病毒本身的研究难度并不大。
通俗地来说,对于一个疑似患者的样本,例如肺部灌洗液,目前的技术可以把各种可能的致病微生物的基因组DNA序列都读出来,编成目录,临床医生和技术人员可以直接阅读这些“最底层”的信息,对比未发传染病患者的样本信息,快速发现可感染人类的新病毒。
据了解,单个冠状病毒基因组大概在26kb~32 kb(1kb=1024字符)。这种长度对于目前测序技术而言,没有特别困难之处,检测成本也在可控范围之内。
然而,关键在于标本的安全性以及对样本间交叉污染的控制。而要排除污染,需要建立符合质量控制和生产规模的高通量检测实验室,这需要花费相当的时间。
此外,采访中,专家还表示,随着疑似患者样本源源不断送出来,检测机构要能在有效时间内抽提DNA并完成测序,然后与已知的新冠病毒基因组数据进行比对,以确定患者体内是否感染新冠病毒。
不过,通过测序来进行诊断,成本和技术要求都较高。目前,主要通过聚合酶链式反应(PCR)检测来对新冠病毒进行诊断。
但科学家们却可以从病毒基因组大样本数据中,寻找出传染能力最强的毒株,进而快速理解传染力的形成,并对之产生相应的最有效的防控策略。
而目前困局是,这样大样本病毒基因组数据库是否存在,没有答案。
以数据追踪“可疑人群”
当前,全国多数城市都采取了严格的手段以遏制新型冠状病毒的蔓延,这就可能通过用户数据进行采集。
对此,上海大数据联盟常务副秘书长马慧民告诉《中国科学报》,“非常时期用非常手段,只要确保采集到的个人位置数据仅用于疫情防控就可以。目前除了三大运营商以外,微信、支付宝等都有用户的基于位置服务的数据(LBS数据),通过整合感染人群的各种LBS数据,就可以还原病毒的传播轨迹了。但是这些LBS数据的采集获取和分析处理需要额外经费投入,根据感染人群规模扩大而增加,建议由政府财政支出。”