同一模型完成多场景任务人工智能大模型或加速技术落地(2)
类比人的教育培养,大模型所完成的培训就如同基础性、通识性的大学本科培养,“学成”后的大模型具备处理一般事物的能力。如果要完成更专业、更高级的任务,大模型还需要“研究生”阶段的专业培养。
黄铁军进一步指出:“AI大模型通常是在大规模无标注数据上进行训练,学习数据中蕴含的特征、结构和知识。”
在这一趋势下,北京智源人工智能研究院2021年3月发布悟道1.0,是中国首个人工智能大模型,取得多项国际领先的AI技术突破;2021年6月发布的悟道2.0,参数规模达到1.75万亿,是OpenAI的GPT—3模型的10倍,一跃成为世界最大模型。
北京智源人工智能研究院学术副院长、清华大学教授唐杰表示,大模型可以包含更多数据,表示更多信息,模型往超大规模发展是一个必然的趋势。
“超大规模预训练模型的出现,很可能改变信息产业格局,即基于数据的互联网时代、基于算力的云计算时代之后,接下来可能将进入基于大模型的AI时代。”唐杰认为。
据介绍,超大规模智能模型的通用智能能力在医疗、金融、新闻传播等行业应用前景广阔。例如,在医疗健康领域,大模型在医疗数据格式化、病历自动解读与分析、自动问诊系统等方面都可以发挥巨大效用。在金融、法律、财务、人力资源、零售等传统行业领域,大模型能提供高性能的智能信息解析和提取、智能数据整合、自动机器翻译、辅助决策等功能,提升业务流程效率和水平。在新闻传播领域,基于模型可实现智能新闻线索收集、机器写作、辅助编辑、虚拟主播等应用。目前,智源悟道大模型,也在为北京冬奥会提供新场景下的人工智能服务应用;并正在通过大模型开启手机AI语音技术新路径,赋能智能终端新一轮AI体验革新。
同质化和涌现特性带来机遇与挑战
最近,斯坦福大学数十位研究者联名发表《基础模型的机遇和风险》综述文章,认为大模型的特点之一是“同质化”,好处在于大模型的任何一点改进就可以迅速覆盖整个AI社区。但同时,它也带来一些隐患,大模型的缺陷会被所有下游模型所继承。特点之二是海量数据训练出的基础模型具有“涌现”特性,也就是产生未曾预先设想的新能力,这种特性有望让AI具备处理语言、视觉、机器人、推理、人际互动等各类相关任务的能力。因此这类模型将赋能各行各业,加快行业的智能化转型,在法律、医疗、教育等领域都会带来具有社会价值的影响。
但同时,如何应对大模型下游的传播问题,进一步提高信息的精准性与适用性,以人工智能大模型技术激活各行各业?
黄铁军回答道:“这是学界现在所面临的共同难题,未来应该从几个方面来减轻甚至消除这类影响:首先就是要关注训练数据的质量,目前一些模型具有的偏见其实都是由训练数据本身所引发的,因此我们要在数据源头上做好保障,既要量大,也要质高。第二,要加强对算法本身及模型内部运作机制的研究,目前深度学习算法的可解释性等理论还在探讨阶段,对大模型的理论分析和缺陷查找能力提出了更大挑战,这就需要加强基础研究,以支撑大模型在那些可靠性要求更高行业中的应用。此外,模型的训练过程中,要加入多模态的数据,比如文本、图片、视频等类型的输入,通过多模态信息内在的多重关联性降低大模型‘偏执’的概率。我们常说人要‘行万里路,读万卷书’,大模型也一样,会随着算法的改进和‘阅历’的增加越来越智能。”
(责编:赵超、陈键)