人工智能大模型应用落地 算力需求该如何满足?
原标题:人工智能大模型应用落地 算力需求该如何满足?
在算力基础设施高质量发展2025年目标时间表的大政策背景下,我国生成式人工智能(AIGC)服务和大模型产业生态发展现状如何?通用大模型和行业大模型产业发展的核心竞争力到底是什么?在产业数字化进程中,国产大模型的“千模大战”状态会持续多久?
想要回答上述问题,我们可以从刚刚在辽宁沈阳闭幕的中国计算机大会(CNCC2023)上寻找答案。作为中国计算机学会主办的计算机领域级别高、规模大的高端学术会议,CNCC今年以“发展数字基础设施,支撑数字中国建设”为主题,在130个技术论坛和20余场专题活动中,有近30场活动都对近来火热的人工智能与大模型做了深层次解析。记者在同期举办的“超智融合AI大模型应用落地发展,高效计算新范式”专题论坛中,找到了一些可以回答这些问题的观点和建议。
算力、算法、数据——AIGC技术发展与安全并重
“无算力、不模型”。自生成式人工智能服务(AIGC)和GPT大模型训练爆火后,围绕算力、算法和数据相关的讨论此起彼伏,中文语境下的国产大模型应用更是呈现出“千模大战”的状态。
今年,我国先后出台了《生成式人工智能服务管理暂行办法》和《算力基础设施高质量发展行动计划》,对AIGC技术与产业发展背后的算力基础设施做了详细规划。其中,《行动计划》从计算力、运载力、存储力以及应用赋能四个方面提出了到2025年算力基础设施发展的量化指标,计算力方面,算力规模超过300EFLOPS,智能算力占比达到35%;存储力方面,存储总量超过1800EB,先进存储容量占比达到30%以上。
智能算力是上述专题活动探讨的主题。围绕人工智能大模型算法优化以及应用落地过程中面临的现实问题,来自中国科学院、中国信息通信研究院、中国人民大学、北京超级云计算中心等产学研用机构的嘉宾共同讨论了技术应用、人才培养、行业创新、内容安全等焦点话题。
“人工智能大模型在业务训练过程中从推理、问答、检测到描述,重点在于解决连续性问题。”中国人民大学高瓴人工智能学院教授、博导卢志武表示,通用大模型在文本、图片、音视频等多模态内容生成能力上还存在许多需要解决的问题,“从多图理解、物体定位、OCR等业务功能上,多模态大模型对于任务预训练和数据指令微调等都需要完善升级,在应用场景落地时,如何通过大模型训练去解决用户的多元化复杂需求非常重要。”
“数据对于大模型的训练和应用来说是至关重要的,现在大模型需要的数据是用哪些数据和指令集类型来让大模型具备什么样的能力。本质上它是一个多样性和覆盖面的研究性问题,这与记忆学习和深度学习的数据有所区别。”中国科学院自动化所副研究员孔庆超认为,人工智能大模型在国内的发展仍需要投入研发力量,行业大模型在不同行业的应用探索是否一定会产生成果,这就需要通过大量的算法去做逻辑推理,例如,金融行业大模型是否有更多算法来支持生成投资决策参考意见,这样的大模型是否具备迭代和学习等能力,都需要做充足的预训练和技术研发。
专家指出,数据、算法和算力是新型信息基础设施的重要组成部分,算力基础设施呈现多元泛在、智能敏捷、安全可靠、绿色低碳等特征,对于助推产业转型升级、赋能科技创新进步等具有重要意义。在生成式人工智能技术方面,打造并完善算力、数据和算法三位一体的协同应用生态,通用大模型和行业大模型都在做应用“减法”,让大模型从“玩具”到“工具”转变。让技术落地、让成果产生价值、让服务匹配业务,这或许就是人们正在讨论的大模型未来生态。