智谱AI推出第三代基座大模型 可在手机上部署

光山新闻网 采集侠 2023-10-28 08:32:01
浏览

小字号

原标题:智谱AI推出第三代基座大模型 可在手机上部署

  在10月27日举行的2023中国计算机大会(CNCC)上,北京人工智能新晋独角兽、清华大学计算机系技术成果转化企业智谱AI推出了全自研的第三代基座大模型ChatGLM3,继此前推出千亿基座的对话模型ChatGLM和ChatGLM2之后再次实现突破。评测显示,在44个中英文公开数据集测试中,ChatGLM3在国内同尺寸模型中排名首位。

  ChatGLM3语义能力与逻辑能力得到了大幅度增强,并实现了若干新功能的迭代升级,包括多模态大模型CogVLM的看图识语义功能,在10余个国际标准图文评测数据集上取得SOTA(State of the art,意为“最先进的”);代码增强模块Code Interpreter可以根据用户需求生成代码并执行,自动完成数据分析、文件处理等复杂任务;网络搜索增强模型WebGLM接入了搜索增强能力,可以自动根据问题在互联网上查找相关资料并在回答时提供参考相关文献或文章链接。

  ChatGLM3还集成了自研的AgentTuning技术,在智能规划和执行方面相比于上一代ChatGLM2提升了1000%,并开启了国产大模型原生支持工具调用、代码执行、游戏、数据库操作、知识图谱搜索与推理、操作系统等复杂场景。以代码功能为例,它既可以让代码“小白”也具备技术能力、为女友写一段能呈现爱心图样的代码,也可以成为程序员的帮手,让它帮助生成或测试一段代码。

  此外,ChatGLM3此次还推出了可在手机上部署的端测模型ChatGLM3-1.5B和ChatGLM3-3B,支持包括vivo、小米、三星在内的多款手机以及车载平台,甚至支持移动平台上CPU芯片的推理,速度可达20tokens每秒(token是语言模型中用来表示单词或短语的符号)。

  近日来,国际人工智能芯片断供对国内人工智能大模型公司的影响备受关注。智谱AI CEO张鹏介绍,自2022年初其推出的GLM系列模型已支持在昇腾、神威超算、海光DCU架构上进行大规模预训练和推理。截至目前,智谱AI的产品已支持10余种国产硬件生态,包括昇腾、神威超算、海光DCU、海飞科、沐曦曦云、算能科技、天数智芯、寒武纪、摩尔线程、百度昆仑芯、灵汐科技、长城超云等。他表示,公司将通过与国产芯片企业的联合创新不断优化性能,助力国产原生大模型与国产芯片早日登上国际舞台。


(责编:曹淼、李源)

关注公众号:人民网财经

关注公众号:人民网财经

分享让更多人看到

推荐阅读 辛继巍:新型工业化助力区域创新与发展     中关村智慧城市信息化产业联盟执行理事长辛继巍发表主旨演讲。 人民网北京10月27日电 (记者杨曦)今日,由人民网主办的“2023 数字经济峰会·工业数字化主题论坛”在武汉举行。…    
“2023全国一刻钟便民生活节”将于11月1日启动     人民网北京10月27日电 (记者孙红丽)据商务部网站消息,为激发便民生活圈新动能,进一步便利社区居民生活,商务部将组织开展“2023全国一刻钟便民生活节”活动。 据悉,“2023全国一刻钟便民生活节”将从11月1日持续至12月31日,按照“政府搭台、企业唱戏、多方联动、居民受益”方式,动员便民生活圈试点地区积极行动起来,充分利用现有便民服务政策,广泛调动各类主体参与,结合老字号、汽车、家电、家居、餐饮、再生资源回收等重点工作部署,自主确定活动内容和举办时间,因地制宜开展社区邻里节、购物节、美食节、团购节等形式多样的便民服务主题活动。…