联通数科朱常波:大模型的关键是应用

光山新闻网 采集侠 2024-07-22 14:05:01
浏览

原标题:联通元景:更懂行业的大模型,产业升级的智能引擎

7月19日,2024中国联通合作伙伴大会在上海开幕。大会主论坛上,中国联通集团公司总经理简勤发布了中国联通人工智能创新成果——元景2.0;在人工智能创新发展分论坛上,联通数字科技有限公司总裁、中国联通人工智能创新中心主任朱常波发表《联通元景:更懂行业的大模型,产业升级的智能引擎》主题演讲,对元景2.0的能力进行了解读。

朱常波介绍,自2024巴塞罗那世界移动通信大会上发布元景1.0以来,中国联通人工智能创新中心经过半年的技术钻研与应用实践,推出了元景2.0,实现了四项能力升级:基座能力升级、MaaS平台升级、安全能力升级和行业应用升级。这四大升级让元景2.0具备了更强引擎,形成了“更易定制、更懂行业、更加可信”的鲜明特色。论坛上朱常波还发布了2040亿元景多模态大模型、元景文生图大模型、元景语音大模型三大基础模型;元景MaaS平台-RAG(检索增强)和元景MaaS平台-智能体核心组件;以及35+个行业大模型和百个优秀案例。

朱常波强调,在智能世界中,模型基座能力就像是根基,决定了模型应用能够走多远、飞多高。元景2.0高度重视基础大模型的核心技术攻关,一是实现了模型参数量级从十亿百亿到千亿级、万亿级的跨越,万亿参数MoE大模型已基本训练完成;二是探索从松耦合多模态到原生多模态的演进,以实现在多模态对话时能够像GPT-4o一样丝滑的效果。

此次元景2.0发布的三大基础模型包括:2040亿参数元景多模态大模型,创新设计使用了复合视觉编码模块,提升了模型感知的精细度,解决了在精准计数、空间感知、精确推理等方面的不足,使得元景大模型在更多确定性场景中可以发挥关键作用;元景文生图大模型创新使用长语句编码模块和级联扩散架构,能够实现高可控的中文文生图,在中文长语句理解、局部强可控修改和中文文字生成能力上实现突破;元景语音大模型,具备一句话克隆人声、类人高自然度及副语言表达、多语种多方言混合生成能力,可实现单模型多任务语音生成。为了更好地展示元景大模型的能力,朱常波在现场进行了特色功能及案例的演示。

基础模型的能力突破为联通元景提供了强大的模型基础引擎。但这远远不够,为了给客户提供“更易定制”的模型能力,元景MaaS平台进行了核心组件和通用组件升级。朱常波在演讲中着重介绍了元景MaaS平台-RAG和元景MaaS平台-智能体核心能力,分别对应大模型使用外挂知识库和使用外挂工具的能力,这两个组件都获得了信通院评级的最高等级认证。

朱常波介绍,大模型使用RAG就像人类首次使用搜索引擎一样,存在“不会查、看不全、找不对”的问题。为了解决因短问题和长文本块匹配度低而“不会查”,元景2.0创新性地使用了级联切分的方法,切出各种长度不同的文本块,实现召回率5%的提升;为解决表格、特别是长表格,在建知识库时被从中间切开而“看不全”的问题,元景2.0创造性地使用了自适应的表格拆分和整合,自动补齐了表头和标题等信息,使表格问答的准确率提升了20个百分点;针对车牌号、故障码等字符串查询“找不对”的问题,元景2.0采用多路检索融合的方式,使回答准确率提升近20个百分点。

元景MaaS平台—智能体则致力于解决让大模型知道“什么时候该使用工具、使用什么工具”这两个难题。一是明确大模型的能力边界,使大模型知道何时自己回答问题,何时使用工具;二是增强大模型的精准意图识别能力,让大模型调用合适的工具来回答问题;三是元景MaaS平台不仅提供100多个工具供用户选择,同时还支持用户DIY自己的工具,定制个性化的智能体。朱常波表示,联通元景也衷心希望生态伙伴将自己优秀的插件、工具接入元景MaaS平台,使元景智能体的能力得到无限拓展。