泛基因组数据库:找到油菜的“好基因”
泛基因组数据库:找到油菜的“好基因”
BnPIR平台 华中农大供图
油菜是世界第二大油料作物,也是我国最重要的油料作物之一。本年头,华中农业大学一支科研步队发布了8个甘蓝型油菜的高质量参考基因组。克日,他们在原有研究基本上,通过整合1689份油菜的基因组及重测序数据,构建了首个油菜泛基因组和较量基因组生物信息平台BnPIR。
有了这一平台,研究人员可以更快捷、更利便地检索和利用油菜泛基因组相关资源。为何建树油菜泛基因组平台?这是一个什么样的数据库?油菜相关的多组学数据研究希望环境如何?《中国科学报》对此举办了采访。
“尺度舆图”有盲区
甘蓝型油菜约莫在7500年前由白菜和甘蓝自然杂交形成,长短常“年青”的多倍体植物。
“多倍体物种,尤其是年青的多倍体植物中,往往存在大量的非同源染色体重组事件,这些重组事件导致甘蓝型油菜内部的遗传变异很是富厚。”华中农业大学生物信息团队副传授杨庆勇说。
而在已往的几十年里,为了提高油菜的产量、品质及适应性等方针性状,海表里油菜遗传育种科学家一连地将白菜、芥菜等种质资源中节制重要性状(如抗性等)的遗传位点,通过杂交可能远缘杂交等手段导入到甘蓝型油菜中,进一步富厚了其物种的遗传多样性。
“现有的研究数据表白,甘蓝型油菜基因组中7成以上基因都存在大的遗传变异,也就是凡是所说的布局变异。换句话说,对付油菜这样的年青多倍体物种,单一参考基因组往往无法很好地包括物种内富厚的遗传变异信息。”杨庆勇进一步表明道。
如何系统挖掘和展现甘蓝型油菜的遗传变异?
杨庆勇先容,传统的遗传变异检测手段主要通过基因组重测序,然后将重测序的读段比对到参考基因组,可以称之为“按图索异”。这里的图是指参考基因组(参考基因组作为生命科学研究中的“尺度舆图”),而我们今朝利用的“尺度舆图”(单一参考基因组)仍然存在大量的“暗区和盲区”。
单一参考基因组为重要性状相关遗传位点和基因的挖掘与操作配置了重重障碍。为了降服这些坚苦,科学家提出了通过整合多个代表性种质资源的基因组信息,构建泛基因组的研究思路和计策。
首个油菜泛基因组
甘蓝型油菜是研究植物多倍化和进化的模式物种。遗憾的是,甘蓝型油菜一直缺乏专门的基因组数据库,研究人员不得不借助芸薹属数据库(BRAD)和其他民众数据库(Genoscope和Ensembl等)来获取甘蓝型油菜的基因组数据。
“这些数据库是基于单一品种基因组和注释,而且缺乏多组学数据和群体变异信息。” 华中农业大学生物信息团队传授陈玲玲说。
据先容,整合多种个另外泛基因组可以越发全面的检测物种内部的遗传变异,得到各个样本的共有和特有的基因集,团结差异样本的表型差别可觉得进一步挖掘重要的农艺性状基因提供基本。
2020年1月,华中农业大学油菜团队与生物信息团队相助,在《自然—植物》上宣布了8个甘蓝型油菜种质基因组序列,并通过较量基因组阐明判断了大量SNPs(单碱基多态性)、PAVs(存在/缺失变异)等变异,构建了巨细约为1.8Gb泛基因组,包括约15万个基因。通过基于PAVs的全基因组关联阐明直接判断到了与角果长度、种子重量和着花时间相关的布局变异。研究发明,多个FLC基因上的PAVs与着花时间和生态型分化细密相关。