棉花“祖先”之一已灭绝?起源之争“尘埃落定”(2)
“A1、A2在异源四倍体棉花中有哪些差别、它们与棉纤维的生长发育有怎样的关系、决定棉纤维的基因群究竟是哪个?这些是我们想研究清楚的。”朱玉贤说。
找到“祖先”之一
早在2014年,朱玉贤团队便解析了全长1700兆碱基对的亚洲棉基因组;2019年,他们进一步通过系统地、全方位地转录分析阐释亚洲棉基因组,获得了迄今为止科学家对亚洲棉基因组的复杂转录全貌所进行的最准确的注释,为进一步的功能基因组研究提供了宝贵的资源。
也是在2019年,朱玉贤开始组织团队解析亚洲草棉基因组。“与6年前相比,高通量基因组测序技术、组装技术和计算机计算速度等得到了快速发展,我们才能获得更高质量的的棉花基因组。”朱玉贤说。
经过一年的努力,研究人员利用PacBio长片段测序技术和染色质高级结构捕获技术(Hi-C)解析了世界上首个高精度的草棉参考基因组,并对陆地棉和亚洲棉基因组进行质量升级。升级后基因组在准确性和完成度等方面具有明显的提高,填补了大量的基因组漏洞,可作为参考基因组。
朱玉贤表示,质量越高的基因组包含的棉花基因越完善,为棉花的基因组研究提供了新的数据资源,这为挖掘控制优良性状基因研究奠定了基础。
接着,研究人员通过构建物种系统发育树发现,A亚基因组的供体可能来源于A1和A2的共同祖先A0。
“为了进一步证实这个猜想,我们对棉花基因组最大的组分转座子进行了系统分析。在朱院士的启发和激励下,我们从根本上革新了棉花转座子的遗传演化算法。区别于以往的算法,我们将棉花基因组完整的和大量碎片化的转座子全部扫描出来,发现棉花转座子不同批次的爆发事件。”论文第一作者、武汉大学生命科学学院副教授吴志国告诉《中国科学报》。
“在以往的研究中基因组最大的组分转座子被称为‘垃圾DNA’或者‘暗物质’,归咎于其巨大的重复数量以及随机的碱基替换事件。”吴志国进一步解释,此研究中革新的转座子遗传演化算法完美的匹配了其巨大数量和随机性等特征,使植物基因组的完整系统分析成为了可能。
随后,研究进一步证实了陆地棉At、草棉A1、亚洲棉A2来源于共同祖先A0。
从进化关系上看,A1基因组比A2基因组更接近于A0。研究揭示出,A0与D5基因组雷蒙德氏棉大约在1.6百万年前(MYA)形成异源四倍体,随后,A0基因组在大约0.7百万年前分化形成现存的A1和A2基因组。
“我们阐明了亚洲棉与草棉独立起源的问题,即亚洲棉不起源于草棉,而是与草棉同时起源于A0,并独立驯化。”吴志国说。
值得一提的是,该研究还发现位于基因区附近的变异位点改变了重要基因的表达,可能最终导致了四倍体陆地棉相较于二倍体棉在纤维品质等性状上有明显的改良与提升。
优质棉花未来可期
“该研究发现现存的非洲棉和亚洲棉可能都不是陆地棉A亚组的供体种,而真实的供体种可能已经不存在,这是棉花基因组进化方面的一大创新性结论。此外,非洲棉和亚洲棉是在陆地棉形成之后才独立分化出来,二者没有祖先与后代的关系。这厘清了长期关于陆地棉A亚组供体种的争论,也是本研究最显著的科学价值。”张献龙说。