计算医学:跑在超算上的医学
计算医学:跑在超算上的医学
谭光明(左)与张春明正在分析数据。
2019年对于吴双(化名)而言是最难熬的一年。年初,本以为是一场普通感冒引起的咳嗽,却未曾想到在3个月后被诊断为中央型肺腺癌第四期,纵隔淋巴转移,伴远端肾上腺转移。
“拿到诊断报告的那一刻,我没有掉一滴眼泪。”说这句话的时候,吴双转头看向窗外,故意将视线避开了记者的目光,但眼角却渗出晶莹的泪水。
吴双,41岁,是一位都市职业女性。患病后,她和家人跑遍了北京多家知名的三甲医院,尝试过靶向药物、化疗、中药等办法,但病情都没有得到缓解。“我还特地花了一万多块钱做了肿瘤基因检测,很遗憾,报告显示是没有可用药的基因突变。”
没有相应的“可用药”,又不能通过手术和放疗进行积极干预,这在临床上只能“盲”用药,即尝试使用临床上常用的一些药物进行治疗,再定期评估治疗效果。但通常盲用药物治疗的效果只能“听天由命”,而在医院,像吴双这样的患者大有人在。
“即便能检测到相应的基因突变,靶向药物对不同患者的疗效也并不相同。”中国工程院院士、中国医学科学院肿瘤医院主任医师孙燕表示,肿瘤的发生是多基因联合“发力”的结果,虽然通过基因检测等手段可以得到海量的数据,但现有的认识仍集中在个别基因与治疗肿瘤的关系,比如携带了致病性突变的BRCA1/2基因与乳腺癌、卵巢癌的关系,突变的EGFR基因与肺癌的关系等。“是否还会有其他基因的参与、每个基因发挥的作用如何,我们不得而知。”
其实,孙燕的这种困惑,也正是目前肿瘤领域最让人“头疼”的难题。对此,中国科学院计算技术研究所高性能计算机研究中心主任谭光明在接受《中国科学报》采访时表示,当前,生物医学大数据的规模和产生速度远远超出了普通规模计算机的处理能力,急需超算助力科学家从多维、立体、融合的数据中摸索出规律,从而更精确地辅助疾病的诊断和治疗。
“查字典”式的有限应用
自人类基因组计划启动以来,以下一代测序技术(NGS)和质谱技术(MS)为代表的各类组学技术得到了飞速发展,再加上传统的显微镜技术、生化方法、免疫组织化学方法、生理体征检测和临床影像拍摄技术等数据源的聚集,使海量生物医学数据呈现指数级增长态势。
不可否认,即便尚未引入信息科学的大型工具,这些大数据也赋予了医生和临床科研人员更多、更细致的维度去了解疾病发生发展过程,大大拓展了医学研究的深度和广度。
“比如,目前对一些明确的、单基因突变引起的疾病,基因组测序已经能实现精准诊断,帮助临床更好地区分不同疾病、施以更恰当治疗。”北京大学第三医院病理科分子病理实验室武睿博士表示,21—三体综合征、新生儿遗传耳聋基因筛查等都是测序技术在临床的良好应用。
但是,对于复杂的、多基因改变引起的疾病,我们尚不能有效地解读患者的生命数据信息。以癌症患者为例,绝大多数突变都具有“个体特异性”,除了个别基因(例如EGFR等),同一个基因在不同患者中能找到相同突变的可能性微乎其微。不过,若从数据呈现的网络调控模型来看,特定信号通路上的关键节点基因尽管发生了不同突变,但驱动的下游细胞内事件可能是相同的。