《疫情防控中的数据与智能应用研究报告》发布(2)
魏凯建议,为保障数据采集的全面和准确性,应同步采用自动化采集工具和数据质量核验等手段,对于多源头数据应明确主要来源,从对应系统或平台中抓取,减少自报数据和重复采集。同时,充分利用大数据技术,实现各类疫情信息的快速实时采集。通过ETL、API、消息队列、数据流等多种采集手段,提供移动端报表采集功能,确保实时准确获取人口流动信息、交通实时信息、重点防控人员定位信息等多类数据,满足疫情特殊时期下的数据资源需求。
数据分析逐渐加深
据统计,2020年2月前的数据应用,60%以上属于初步的描述性应用,如疫情分布地图、人员流动展现等。例如,航空和铁路部门在疫情初期发现确诊患者后,通知同航班和同车次的旅客进行重点关注和隔离。
随着平台的建设和数据的逐步积累,诊断类应用愈发成熟,预测类应用逐步增加。2月初,描述类和诊断类应用的占比达到75%,数据粒度和分析粒度都更加细致,区县级甚至社区级的应用开始出现。例如,百分点信息科技的“一区一码”系统,居民完成个人信息填报,进出小区时由系统自动分析辅助人工管理。预测类应用,如潜在传染源和传染路径预测、传染人数趋势预测等开始出现,并逐步用于政府的决策参考。
魏凯表示,预测和决策类应用复杂程度高,数量虽少,但具有更高的价值。此次疫情防控过程中,大数据和 AI 技术被用于病毒基因的检测分析中,基于病毒基因的特征,预测病毒蛋白结构辅助药物筛选,大大提高了诊断和疫情研究的效率。
“数据由描述性分析、诊断性分析、预测性分析逐步向决策性分析转变。整体来看,前期各类描述、诊断、预测类应用的成熟为政府后续的精准施策打下基础。”魏凯说。
版权声明:凡本网注明“来源:中国科学报、科学网、科学新闻杂志”的所有作品,网站转载,请在正文上方注明来源和作者,且不得对内容作实质性改动;微信公众号、头条号等新媒体平台,转载请联系授权。邮箱:shouquan@stimes.cn。