人工智能新模型可解码DNA隐藏“语言”

光山新闻网 采集侠 2024-08-07 11:08:01
浏览

人工智能新模型可解码DNA隐藏“语言”

小字号

原标题:人工智能新模型可解码DNA隐藏“语言”

科技日报北京8月6日电 (记者张佳欣)DNA包含了维持生命所需的基础信息。理解这些信息是如何存储和组织的,一直是20世纪最大的科学挑战之一。现在,借助GROVER这一基于人类DNA训练的新型大型语言模型,研究人员有望解码基因组中隐藏的复杂信息。GROVER由德国德累斯顿工业大学生物技术中心开发,它将人类DNA视为文本,通过学习其规则和上下文来提取DNA序列的功能信息。这一新工具有望彻底改变基因组学并加速个性化医疗的发展。相关研究论文发表在新一期《自然·机器智能》杂志上。

大型语言模型通过文本训练,发展出了在多种语境下使用语言的能力。研究人员设想将生命代码DNA当作一种语言,训练了一个大型语言模型——GROVER。

在语言方面,人们谈论的是语法、句法和语义。而对于DNA来说,这意味着学习核苷酸的序列等。就像GPT模型学习人类语言一样,GROVER基本上学会了DNA“语言”。

研究表明,GROVER不仅能准确地预测接下来的DNA序列,还可用来提取具有生物学意义的上下文信息,例如识别DNA上的基因启动子或蛋白质结合位点。此外,GROVER还学习了“表观遗传”过程,即在DNA序列不发生改变的情况下,基因表达的可遗传变化。

GROVER有望解锁DNA中蕴含着关于人类本质、疾病易感性以及对治疗反应的关键信息。研究人员相信,通过语言模型理解DNA的规则,将有助于揭示隐藏在DNA中的生物意义,从而推动基因组学和个性化医学发展。


(责编:杨曦、陈键)

关注公众号:人民网财经

关注公众号:人民网财经

分享让更多人看到

推荐阅读 县域旅游“热”力足 点燃区域经济发展新引擎     在“陇上江南”品西北美食、在西南边陲打卡“中国最大乡村图书馆”……近期,县域旅游持续走红,原先静谧安逸的县城变得热闹喧哗,县城文旅产业持续火热,地方经济迎来新的增长点。 从品尝农家菜到沉浸式体验传统文化,从亲近山水田园到漫步乡村小路,县域旅游频频“上新”,持续释放消费新活力。…    
新电商,如何“潮”出屏幕“焕”活市场?     今年的李子季,四川省简阳市贾家镇农户刘照东对收货量充满期待。前些年,刘照东每年收购量有限;去年,他尝到了电商收购的甜头,整个李子收获季,收购量达到数百万斤。…