西安交大等进一步揭示癌症复杂性(2)
作者们又进一步通过深入分析4645个全基因组和19184个外显子组的84729690个体细胞突变,该研究绘制了比以往研究更全面的突变轨迹图谱,揭示了突变轨迹与多种外源和内源性因素的复杂关联。
该研究首次确认了10余个基因组结构变异的突变图谱,包括先前没有给予足够关注的多源、复杂串联重复、重排变异等。研究再次证实了包括常见和罕见的胚系变异,即遗传风险会影响体细胞突变的模式和轨迹。这些轨迹图谱能够为肿瘤筛查、组织溯源和精准诊疗提供指导。在此基础上,该研究运用信息技术重建了癌症突变的演化历程。在约40%的样本中,突变谱在整个演化历程中都出现了显著的变化:特别是驱动突变往往在诊断前的数年、甚至十数年就已经出现,且与其他因素共同决定着癌症的进化轨迹。这些结果为癌症体检和早诊提供了重要的科学依据,也强调了在癌症临床诊疗中使用更全面的如全外显子组测序等大数据的重要性和发展趋势。
此外,该研究系统地鉴定了649个体细胞突变与基因表达的关联关系,率先观察到近2000个与体细胞突变相关的剪接改变,75种称为“桥接”的新型融合基因。在信息技术层面,该研究首创了多种计算和统计模型、算法和流程,能够显著提高结果的敏感性和特异性。
据悉,上述研究成果与其他国际大科学计划相同,采用标志性论文唯一集体作者(又称机构作者)署名,分组成果论文集体作者和个人作者结合署名的形式。集体作者按分组编号和字母序排序,排名不分先后。上述8篇论文中西安交大生物信息计算攻关团队的署名作者包括王嘉寅教授、杨善林院士(双聘)、张选平教授、夏天教授(华中科技大学)、丁帅教授(合肥工业大学)、萧笑博士和黄毅博士。攻关团队参与了体细胞突变检测新技术组、驱动突变与功能解释组的工作,包括数据测试与质控、针对人群/种群数据的参数优化、高特异性检测等。
相关论文信息: https://doi.org/10.1038/s41586-020-1969-6
https://doi.org/10.1038/s41586-020-1943-3
https://doi.org/10.1038/s41586-020-1965-x
https://doi.org/10.1038/s41586-019-1913-9
https://doi.org/10.1038/s41586-019-1907-7
https://doi.org/10.1038/s41586-020-1970-0
https://doi.org/10.10.1038/d41586-020-00308-w
https://doi.org/10.1038/d41586-020-00213-2