建立中国人自己的基因组技术体系路有多远
原标题:建立中国人自己的基因组技术体系路有多远
“唐尧”基因组相关研究成果发表在《基因组蛋白质组与生物信息学报》上,图为当期杂志封面。受访者供图
【深瞳工作室出品】
采 写:本报记者 操秀英
策 划:刘 恕 李 坤
何忠(化名)没有想到,自己身上不到20毫升的血液样本,竟成就了一项被中国工程院院士、哈尔滨医科大学党委书记张学评价为“我国乃至世界范围内里程碑式的事件”的成果。
利用何忠的血液样本,北京大学人民医院教授高占成团队和中国科学院北京基因组研究所(国家生物信息中心)研究员康禹团队首次在世界范围内成功完成从端粒到端粒的中国人全基因组,获得包括Y染色体在内的高质量真实人类二倍体以及完整无间隙的全基因组参考序列(44+XY)。
因为这个采样点位于山西省临汾市——几千年前尧帝建立的古唐国遗址附近,研究团队将该参考基因组命名为“唐尧”。
在人们印象中,人类基因组图谱早已公布,如今普通人的基因组也很容易被测出来。为何“唐尧”基因组会被评价为“里程碑式的事件”,这一基础研究领域的突破意味着什么?科技日报记者对此进行了采访。
现有人类参考基因组用于中国人有偏差
这是一项由临床应用需求催生的基础研究。
过去几十年,北京大学人民医院呼吸与危重症医学科主任高占成的主要工作是接诊来自全国各地的呼吸科疑难杂症患者。他带领团队首次诊断出多例孤儿肺病,如弥漫性肺淋巴管瘤病、肺泡蛋白沉积症等。
诸多案例丰富了他的医学实践,但也给他带来了诊疗困惑。不少疾病综合征在不同种族人群中的临床表现存在不小的差异。
“目前所有的肿瘤、遗传病等测序诊断报告,均根据美国主导的GRCh37/38为人类参考基因组序列来判定正常或变异。”高占成说,GRCh37/38是来自多个人类个体基因组序列嵌合而成的一套基因组,主要来源是非洲和欧洲人。它不但不完整、错误多,而且难以代表中国乃至亚裔族群。
以遗传性肺囊性纤维化为例,这种病在欧美白人中表现为跨膜氯离子转录因子突变导致的功能缺失。但在中国患者中,该转录因子突变的发生率要小得多。
“预测疾病风险和诊疗时,对于亚洲人种而言,仅对照现有参考组,可能会产生较大的偏差。”高占成说,这种偏差还会影响靶向药物的研发。
2003年,国际知名药厂阿斯利康在全球率先研发成功表皮生长因子受体酪氨酸激酶抑制剂(EGFR-TKI)——吉非替尼,适用于存在表皮生长因子受体(EGFR)基因突变的非小细胞肺癌患者。
随后的研究发现,EGFR基因突变存在明显的种族特异性。中国和东亚种族不吸烟肺腺癌患者的突变率明显高于欧美白人患者。
“目前的主流观点认为,不同人种基因组之间的差别只有千分之一。但从临床实践来看,实际差别可能远大于这个数字。”高占成说,“所以,我们有必要构建中国人自己的参考基因组。”
但对于一个临床医生来说,这是个全新且较难攻克的课题。
2020年,一个合适的契机到来。
这一年,设在山西省临汾市中心医院的高占成呼吸病学山西工作室开始筹建。
“这个工作室绝不能仅仅挂个牌子,要有具体的课题,能解决实实在在的问题。”高占成说,绘制中国人自己的参考基因图谱被提上日程。
他立即联系他带的第一个博士生,也是多年的合作伙伴——中国科学院北京基因组研究所研究员康禹。