人工智能辅助科研要从可用走向可信
原标题:人工智能辅助科研要从可用走向可信
对于科研工作者来说,检索、阅读文献是一项费时费力的工作。在大模型发展如火如荼的今天,以其为代表的人工智能正渗透进人们工作生活的各个角落,科研领域也不例外。
日前,阿里巴巴发布了基于Transformer架构自主研发的千亿参数级夸克大模型。据介绍,该大模型可用于科研资料收集、文献快速阅读与翻译、创作润色等场景。
不仅是阿里巴巴,科大讯飞股份有限公司(以下简称科大讯飞)、腾讯等企业,也都推出了用于辅助科研的大模型产品。这一系列产品的问世,正悄然改变着科研工作者的工作方式。
大模型已进入科研领域
今年初,ChatGPT的走红掀起了语言大模型热潮。人们可以随心所欲地提出问题,大模型总会给出答案。这股风很快也吹到了科研领域。ChatGPT发布后不久,一款名为txyz.ai的应用插件在科研圈中受到追捧。
这是一款借助ChatGPT的强大理解能力,专门用来阅读科研文献的插件。用户可以直接将论文全文上传至该应用,并提出相应解读要求,它便能够以最快速度对用户提出的问题予以回答。
即使没有下载论文全文也没关系,txyz.ai支持对论文预印本网站进行检索。用户可以只提供一个论文ID序号,txyz.ai就会自动检索、学习该论文,并根据用户需求给出回答。不仅如此,用户还能以聊天的方式与其进行对话,就论文中的内容提出各种问题。
视频网站哔哩哔哩知名科普博主严伯钧是txyz.ai的忠实用户,他时常在各类科普视频中使用txyz.ai来协助解读论文。在他看来,txyz.ai给出的论文解读准确率已经非常高,具备很强的实际应用价值,可以帮助科研工作者更加高效地检索、阅读文献。
“txyz.ai无法解读的情况当然也会有。”严伯钧表示,以他的使用经验来看,向txyz.ai提出的问题必须是一个能被回答的“有效问题”,“如果问题问得太细、太深,或者过于刁钻古怪,那么它就会直接告诉你,无法回答”。
但必须承认的是,在大模型迅猛发展并逐渐进入千行百业的今天,专门针对科研领域的大模型产品仍然不算多,且大多数是试验性质的产品。
不久前,科大讯飞在发布最新版本的讯飞星火认知大模型V3.0时,也一口气发布了12个面向行业的专用大模型。其中便有联合中国科学院文献情报中心共同研发的、面向科研工作者的科技文献大模型,以及基于该大模型的应用产品——星火科研助手。这也是国内为数不多的专门为科研工作推出的大模型产品。目前,星火科研助手有成果调研、论文研读、学术写作三大功能。
浙江大学第一附属医院图书馆工作人员以“大语言模型”为关键词对星火科研助手进行了试用。在“成果调研”板块,星火科研助手在检索到的1251314篇文献中遴选了167篇文章进行分析,给出了关于大语言模型的概述。其还可以进一步从遴选的167篇文章中勾选最多30篇文章,据此生成综述。
星火科研助手的论文研读功能则采用当前大语言模型通用的问答模式,可默认生成论文摘要、方法、结论等主要信息;用户也可以就自己关心的论文内容进行提问,科研助手会根据文章内容进行回答。其学术写作功能则主要聚焦科研文章的翻译与润色,目前支持中英文互译,也可以对研究人员撰写的英文文章进行润色。
须保证内容真实且专业
由于技术原因,大模型有时会出现编造信息、“一本正经地胡说八道”的现象。这种现象在业内被称为AI幻觉。生活中,人们在和大模型聊天时,如果出现了AI幻觉,人们可能会一笑了之;但若AI幻觉出现在追求严谨精确的科研领域,后果可能就会很严重。