高文:鹏城实验室是国家实验室的种子队 而且是最大一颗种子

光山新闻网 刘洋 2020-11-15 00:00:00
浏览

  11月11日至15日,第二十二届中国国际高新技术成果交易会将在深圳举行。本届高交会以“科技改变生活、创新驱动发展”为主题,总展览面积超过14万平方米,有3000多家海内外展商、近万个项目参展,各项活动将超过140场。中国工程院院士、鹏城实验室主任高文出席并演讲。

  高文表示,鹏城实验室是2018年3月份在深圳成立的一个广东省实验室,当时广东省设定这个实验室的动机是要培育一批国家实验室的种子队,鹏城实验室就被作为种子队当中的种子,而且是最大的一颗种子。设立这个实验室的时候,鹏城实验室工作的领域在信息通信,特别是通信与人工智能这个领域。当然现在不辱使命,已经完成了省里和深圳市交给鹏城实验室的任务,现在国家给鹏城实验室设定的研究领域用三个主题词来说就是网络、通信、智能。

  以下为演讲实录:

  高文:各位领导、各位嘉宾,大家上午好!刚才邬院士给大家送上了一顿大餐,我怕大家消化不良,别讲得太快,把刚才邬院士讲的很多非常有价值的东西很快就冲淡掉了,所以我尽量慢点说,把不重要的事就跳过去。

  今天我为大家讲的是关于鹏城实验室与鹏城云脑。鹏城实验室是2018年3月份在深圳成立的一个广东省实验室,当时广东省设定这个实验室的动机是要培育一批国家实验室的种子队,鹏城实验室就被作为种子队当中的种子,而且是最大的一颗种子。设立这个实验室的时候,我们工作的领域在信息通信,特别是通信与人工智能这个领域。当然我们现在是不辱使命,已经完成了省里和深圳市交给我们的任务,现在国家给我们设定的研究领域用三个主题词来说就是网络、通信、智能。这个实验室从成立一开始,我们做了很多探索,一个最重要的探索就是我们采用双轮驱动模式,一只轮子是项目驱动,就是设定了一些以国家重大需求为研究目标的一批重大项目;另外一只轮子是自由探索,我们采用院士工作室制度,我们选定一些在这个领域里面相对年轻比较活跃的院士,每年给他们1000万人民币,让他们做自由探索,而且这个自由探索不像其他地方给钱要申请,要评审,最后通过不通过还要砍掉多少钱,我们全都没有,我们就信院士了,一千万都是你说了算,你只要不违反规定,你想雇谁就雇谁,你想怎么花怎么花,你想干什么干什么,你每年要写一个工作计划,这个工作计划报到我们,我们阅,然后就放到抽屉里。这不是说没用,有用,我们到年底的时候会拿出来跟院士对照一下,你年初是这样想的,你今年一年下来和年初想的一样不一样。

  我们现在完成了作为种子队的历史使命,国家给我们的任务是让我们在通信、网络、智能三个方向上展开研究,所以我们自己设定了一个使命与愿景,三句话把我们的使命和愿景表达得比较清楚。第一句话是“交流无障碍”,这是指通信,通信是指人和人、人和机器、机器和机器之间能够实现通信,它最高的境界就是交流无障碍,这个可以解释任何东西,协议上无障碍、带宽上无障碍、语言种类无障碍、交流无障碍。第二句话叫“连接无极限”,网络就是做连接用的,可能是终端和终端的连接,终端和设备之间的连接,人和终端之间的连接,或者是一些具有物理地址的终端和其他任何一个有地址的终端之间的连接。我们说连接无极限就证明不管你在什么特定的网络条件下,不管你采用什么命名机制,不管你用什么协议都能连到一起进行通信。第三句话叫“进化无止境”,现在人工智能无非就是想把人具有的智能用机器给模拟仿真出来,甚至要比人更强一些。这是要通过机器学习的办法,不停地让计算机、机器人对智能的仿真要做得越来越好,要不停地进化、不停地迭代。我们说进化无止境,就怕你想不到,没有做不到。

  鹏城实验室作为一个能够支撑国家重大任务研究的研究机构,它的能力在哪方面体现?可能有的人说你要有最好的园区,有最好的研究大楼,是吗?是,也不是。有的人说你要有最好的研究人员?是吗?是,也不是。有的人说你要有最好的研究设施、研究平台,让国内甚至国际上最好的人能到你这里来研究?是吗?是。我们最重要的任务是要做平台。刚才说我们有三个特定的方向,在三个特定的方向上,鹏城云脑就是为智能这条线所提供的平台。

  鹏城云脑是我们刚才说的进化无止境这里面最重要的一个基础设施,你想做智能的演进,你想做模型的训练,你就需要有非常好的装置。我们知道学校里面的研究生和老师辛辛苦苦申请到了几十万、几百万的经费,买几个GPU的卡,性能好一点的几万块钱,再买好一点的十几万块钱,可能买几块性能好的卡构成经费就没了。这些钱从哪里来?学校是花不起的,公司花得起,但公司有它的商业诉求,它不可能把这个东西开放给真正做研究的人去用,开放给那么多投入的人去用,是不可能的。怎么办呢?我们来提供。所以要想进化无止境,对于研究群体或中国的研究社区来说,需要一个智能的基础设施,鹏城云脑就是我们想提供出来的基础设施。

  为什么需要建这个鹏城云脑呢?前期我们一开始有这个想法的时候,包括跟地方领导,包括跟省里、市里的,包括跟发改委领导汇报这个项目的时候,他们的第一个问题是现在国家已经建了这么多超算中心,深圳有超算中心,广州有超算中心,上海有、天津有、无锡有,国家有那么多超级计算机中心,为什么你还要做一个?后面我们告诉他们说,传统的超算做人工智能的训练效率太低。前两天我们工程院有一位领导专门写了一篇文章,说你要用传统超算做人工智能的训练,它的效率是比较低的,大概是多少呢?AI算力275分之一,现在超算的峰值速度,做人工智能的工作要除以275,这才是真正的性能。这就等于你用一只很大的马拉一个极小的车,那真是资源的浪费、能源的浪费、算力的浪费。怎么办呢?我们要做一个专门面向人工智能的装置,我们把这个叫做AI超算或AI超级计算,我们在这叫鹏城云脑。现在做机器学习,做深度神经网络的训练,它里面用的架构和传统的解方程是完全不同的架构,所以必须要能适应这种新架构的方式,所以现在的人工智能超算是专门为了机器学习,为了训练深度网络所设计的一台机器。

  我们想清楚了以后就要开始做,从2018年鹏城实验室一成立的时候,我们就下决心要做鹏城云脑,当时我们提出了鹏城云脑I的目标,那时候我们考察了国内国外所有可能的解决方案,我们最后决定要选择英伟达的GPU作为我们鹏城云脑I的主力计算单元。当然不光是英伟达的芯片,当时我们设计里面也包括有寒武纪的芯片,也包括谷歌的芯片,当时我们设定了若干个芯片。但现在实际上运行最好的还是英伟达的机器,所以现在鹏城云脑I已经有100P的算力,这个算力是多强呢?1亿是10的8次方,亿亿是10的16次方,100亿亿是10的18次方,2021年世界上最强的超算会是100亿亿这么大的算力。鹏城云脑已经是100P,100P是多少呢?10的17次方。当时我们把英伟达的机器装好了以后发现这个机器还还是只能玩点中小型的训练,真正做大型的训练还是不行,做不了,怎么办呢?我们就下定决心设计鹏城云脑II,这个机器从开始启动论证到最后装机完成,深圳经济特区建立40周年采访王伟中书记的时候有一个对话节目,在上面我说了几句话,最后央视也采用播出来了,深圳速度,这台机器鹏城云脑II,从开始启动论证到最后装机完成9个月,这在以往任何大型的科学设施建设过程中是不可想象的一件事,通常是7-10年,我们是9个月。花了多少钱呢?42亿。一般发改委批的一个大科学装置就十几亿,我们是42亿,9个月就把这个机器做出来了。这个机器是1000P,也就是100亿亿次,我们的AI算力是100亿亿次,如果超算的算力要想做AI的时候和我们一样的算力怎么办呢?要在这个基础上再乘上275,那可能若干年后才能达到这个速度。所以从AI算力来讲,它的能力已经是世界最强的一个机器了。这台机器采用的是华为的核心芯片NPU,专门面向深度学习的处理芯片,用这个芯片构造的人工智能节点,人工智能节点一共有1024个,华为原来做的阿特拉斯900AI服务器,我们用的是类似于从硬件资源,相当于是4个阿特拉斯900服务器的构架,但是整个网络结构里面的硬件配置都做了很大的调整和改变,所以它的性能是非常好的。这台机器在10月22日已经满负荷运行了。

  这台机器除了峰值指标在AI选择方面是最强,有没有也要参加全球Top500比赛呢?我们已经提交了测试的数据上去,大概在今年11月下旬就会知道我们能不能排到第一。其中有一个赛道是IO500,就是输入、输出排名世界前500,我们现在的成绩比上一次的成绩是多少呢?上次IO500排第一的得分是1700分,我们这次提交的成绩是多少呢?7000分。按照以往的经验,我们这个至少可以两年排第一,当然因为现在技术进化很快,我们要等揭榜那一天才知道排第几。人工智能训练最重要的是要有数据大吞吐进和出的能力,进的是训练数据,出的是训练参数,吞吐要非常大,IO就是负责这方面的,这个排在最前面,说明做人工智能训练的能力是最强的。

  有了机器,我们要把机器用好,除了硬的之外,我们在上面设计了软的东西,同时配套了联盟、社区、开源的各种各样活动比赛来支持个硬件发挥它在人工智能里面的作用。比如我们可以用它做云脑大数据模型训练,通过数据上传、模型训练等适配,最后可以启动应用。16万个AI科研训练任务目前主要是在鹏城云脑I上完成的,因为这是完全免费的,向全国开放的,鹏城云脑II上来以后训练任务至少在这后面加一个零。我们用这个装置,现在在深圳已经进行了关于智慧城市,特别是交通数据的实时智能处理典型案例的实现,用了这套系统以后,在光明区那个地方检验的结果,平均汽车行驶时间可以缩短15.7%,通过训练调整信号灯的控制。

  为了把这个机器做得更好,我们在科技部下面成立了新一代人工智能产业技术联盟,希望打造一个国家级的开源开放基础平台,这个联盟里面有15个国家级的开放平台,比如第一批的科大讯飞、百度、腾讯、商汤等。第二批去年又有10家,这15家是国家的开源开放平台,在上面构建若干个池,提供最好的开源生态。新一代人工智能开源开放平台,我们采用一体两翼,左翼是以技术专家为主体组成的多个工作组,右翼是以企业为主体的应用推进组。在开源生态里面有三个板块来推动开源的发展,一个是精品店,目前主要是5个国家级的开放平台,以后我们会发现很多东西也会推到精品店。私房菜是在特定领域做得比较好,比较成熟的可以直接拿去稍微调整就可以使用的方案。大集市是通过这个社区大家可以在那里自由讨论、自由买卖、自由观摩。精品店主要是以15个国家开放平台,今后会加上做得比较好的东西,经过测试是完全可以快速应用的,我们就推了精品店。除了这三个板块以外,我们对特定的应用领域也予以关注,比如我们对开源芯片平台特别关注,主要是基于RISC-V处理器,我们会专门提供一个开源SOC芯片平台这样的开源项目来支持它。大集市,我们不光让大家在这上面可以自由展示你的东西,同时我们还提供一个比较好的托管平台,现在一般的开源托管平台是放在GitHub上,现在有很多担心说以后不能访问那个网站,中国的人工智能就没有办法发展了,我们就提供了国内的iHub的平台供大家使用。我们组织人工智能大赛提升社区的认可度,以及奖励那些做得好的,从前年开始,全国人工智能大赛在深圳是一个很大的活动,每次都是市长亲自挂帅做总牵头,奖励很丰厚,比如一等奖是100万,二等奖是50万,所以参赛的队伍很踊跃,去年有4000支队伍,今年有6000支队伍。这就是关于鹏城实验室和鹏城云脑,如果大家对我讲的内容感兴趣,欢迎大家跟我们联系,谢谢大家!

  新浪声明:所有会议实录均为现场速记整理,未经演讲者审阅,新浪网登载此文出于传递更多信息之目的,并不意味着赞同其观点或证实其描述。