人工智能大模型应用落地 算力需求该如何满足?(2)

光山新闻网 采集侠 2023-11-04 16:44:03
浏览

中国科学院计算机网络信息中心人工智能部副主任王珏认为,国产大模型在应用落地和业务适配方面,关键在于数据清洗。“我们也在尝试各种模型,无论是准确度还是计算效率,面临的挑战就是国产开源大模型的稳定性,这方面我们做了很多工作,通过文献数据促进各学科科研发展。同时,让国产大模型好用也是我们的研究方向。”

“人工智能、大数据、云计算等新一代信息技术加速了大模型的发展。通用或行业大模型研究训练离不开大量的算力支撑。”并行科技董事长陈健博士认为,从产业发展的角度来看,算力是工业产品,行业大模型训练对于算力的需求需要找准方向才好发力。

技术、应用、生态——提升大模型准确率与效率

大模型应用对于高频次的算力资源需求,往往与大模型升级迭代的多元场景应用能力建设息息相关。当前、中文语境下的大模型生态还面临哪些问题,交叉学科人才培养合作机制和产业链上下游能为大模型带来哪些深层次变革?在接受记者提问时,多位嘉宾也谈到了目前大模型所提供服务过程中亟待解决的一些行业性问题。

早期AIGC技术的发展,从各个链条和语义理解上产生了大量的大模型内容生成的“幻觉”问题,即“一本正经的胡说八道”。在中国信息通信研究院融创中心主任田辉看来,新兴技术的行业应用一定是需要产学研用结合才能健康的状态,“AIGC技术的分工角色更细,产业应用的开发、部署和应用都是需要产业链共同合作。如大模型的二次开发,迭代升级、运维服务等领域的人才培养机制,都需要细分与合作。”

AIGC技术产业进入“千模大战”状态后,最终我们所依靠的核心竞争力是什么?业内人士认为,AIGC技术产业的发展方向或路径是从人工智能技术升级方面,提升大模型的理解、生成、逻辑推理和记忆等核心基础能力;在场景应用落地方面,强化大模型的学习能力,提升生成服务准确率和效率;在行业生态建设方面,提升大模型的智能化水平和生态应用空间,打造成为辅助决策的实操性工具。

“北京超级云计算中心采用超算架构模式构建智能算力资源,将分布在国内的各大算力中心资源进行整合,可以最大限度地利用现有资源,降低因空闲资源浪费而产生的损失。同时也可以有效满足人工智能大模型训练对算力的高频次需求。”北京超级云计算中心吴迪介绍说,以超级计算机为代表的超算架构能够提供更加全面高效的并行计算能力,为大模型训练处理提供算力服务支持,实现更高效的模型训练以及更好的预测准确度。

王珏表示,行业大模型的发展离开算力就会拉大行业差距。“让算力资源能更好地去跑这些大模型,保持其精度或者泛化能力不变,提升大模型训练的速度和效率,能够真正并尽快在大模型训练上实现全栈国产化,这是研究的热点。”

“希望大模型的行业应用发展看到有百花齐放的生态,但需要关注的是低水平重复工作的问题。无论是数量还是类型,大模型的产品或商业形态还有很多探索空间。”田辉认为,AIGC技术的发展最终的落地在于内容服务。“如何提升准确率和效率,谁的平台投入的力量足够,大模型训练的速度和效率,以及应用适配更强,谁就能突破成功。”


(责编:崔元苑、吕骞)

关注公众号:人民网财经

关注公众号:人民网财经