竞速大模型:一手创新策源,一手落地应用
百花齐放、竞相涌现,2023年至今,大模型带火的通用人工智能赛道,出现了众多玩家。科技部新一代人工智能发展研究中心等机构发布的数据显示,中国10亿参数规模以上的大模型已发布79个。这一席卷科技界的AI革命,将如何改变世界?大模型又将如何一手促进创新策源,一手服务实体经济?在从业者看来,这场竞速赛才刚刚开始。
大模型探索大应用
在位于上海临港新片区的商汤科技智算中心一楼展示大厅,可以和大模型“商量”,用中文“商量”一下。
记者在现场感受发现,作为千亿级参数的自然语言处理模型“商量”,它不仅可以进行多轮对话、人机共创童话故事,还可以自动生成简单代码、进行“文生图”等。例如,在输入了20张“港风”照片后,生成式AI就可以自动生成一张类似风格的“氛围感”图片。
“无论是让大模型写出一首质量过关的古诗,还是根据描述生成图像,都要求其对中文语言的理解足够深刻。这需要经过多轮对话的训练,包括辅助语料的投喂,才能逐渐让模型理解汉语的规律。”商汤科技首席科学家王晓刚说。
语言类大模型不是唯一形态,多种通用大模型正在持续拓展应用场景。科技部新一代人工智能发展研究中心等机构发布的《中国人工智能大模型地图研究报告》显示,中国研发的大模型数量排名全球第二,仅次于美国。
一方面大模型从办公、生活、娱乐向医疗、教育、设计等行业加速渗透;另一方面,一些垂直专业类大模型不断深化落地,生物制药、遥感、气象等大模型正在发挥纵深优势。
4月初,上海人工智能实验室联合中国科学技术大学、上海交通大学、南京信息工程大学、中国科学院大气物理研究所及上海中心气象台发布全球中期天气预报大模型“风乌”,30秒生成未来10天全球气象高精度预报结果。
在气象气候预报任务中,全球中期天气预报是重要预测任务之一,它以预测未来14天内的大气系统状态为目标。“风乌”在预报精度上降低了误差,在时效上突破了10天,而且仅需单GPU(图形处理器)便可运行。
上海人工智能实验室领军科学家欧阳万里说:“‘风乌’取名自秦汉时期的‘相风铜乌’,是世界上最早的测风设备。天气预报大模型‘风乌’承载中国古人的智慧,也寓意实验室致力于在以气象为代表的人工智能服务科学领域不懈探索。”
大算力搭建新“底座”
出台支持举措、整合创新资源、布局新兴赛道……近段时间以来,各地都在为人工智能的创新策源“铺路”。
5月30日,北京发布《北京市加快建设具有全球影响力的人工智能创新策源地实施方案(2023—2025年)》《北京市促进通用人工智能创新发展的若干措施》等方案;深圳发布关于加快推动人工智能高质量发展高水平应用行动方案;上海市经信委表示,超大规模预训练模型是人工智能从专业智能走向通用智能的关键技术,未来将加快研究打造大模型生态集聚和创新应用高地,推进算力资源统一调度。
算力是研发大模型必不可少的基础设施,已成为不少城市争相布局的焦点。“近期生成式人工智能等应用大爆发,推动了算力需求激增。很多企业在落户前都会问,算力需求能否被满足,这已是一种稀缺资源。”上海临港新片区管委会高科处处长陆瑜说,这也是临港发力构建更为完善的算力产业生态、搭建公共平台的初衷。
瞄准产业痛点,智能算力更需要一体化调度、经济化使用。专家认为,“东数西算”工程的全面实施,将一手促进东部数字经济产业链向西部延伸拓展,一手让算力资源精准配置和按需获取,有效降低能源消耗。