搜狗陈伟 :AI要把人从反复性事情解放出来 做更创新的事情
中新网5月25日电 最近,各信息平台出现的新华社新闻播报引来大家关注,原因就是一些新闻不是真人播报,而是运用AI和3D技术打造的虚拟数字人主播播报。直观来看,单从声音很难分辨出是真人还是虚拟人物,如果不是标题标注“AI主播”字样,大家很难分辨出这是AI的虚拟人物主播在播报新闻。这就是搜狗联合新华社推出的3D AI合成主播“新小微”。
搜狗3D AI合成主播采用领先的扫描还原算法,以及面部肌肉驱动、表情肢体捕捉等超写实3D数字技术,生成高度还原真人发肤的形象逼真的数字人物模型,,在搜狗分身AI算法的驱动下,只需输入文本内容,这个数字人模型就能根据语义实时播报新闻。重要的是,AI虚拟人物主播的表情唇动、肢体动作和语音表达高度契合,自然逼真度接近真人。
据了解,搜狗的AI主要沿着两条线发展,一个是自然交互,一个是知识计算。核心是语言AI。通过人和机器之间进行非常自然的交互设计,从而达到自然逼真的效果,这其中也使用视觉和听觉的能力。;在知识计算上有三部分能力:对话、问答、翻译。而目前的AI合成主播涉及到搜狗整个AI技术链条上的核心技术。
搜狗AI交互技术部总理陈伟近日接受媒体采访介绍到, 联合新华社打造的3D AI合成主播项目研发周期有半年左右,其中包括数字人物建模、动作采集。 毕竟现在数字人本身的技术不是很成熟,搜狗AI希望能更快速地构建一个好的3D建模能力和数据能力,更重要的是打通3D技术和AI技术。
事实上虚拟人赛道上不少头部企业都有涉猎,对于较早入局的搜狗也有自己的看法,陈伟认为,真正的AI有外在的AI也有内在的AI。外在的AI就像“搜狗分身”具备逼真或者高逼真的形象。
他还指出,现在的语音助手、电视、音像等用户的一个助手,按照拟人化的方式来沟通,大部分公司还停留在做一个语言助手或者做一个有对话能力的机器人。但陈伟认为人机交互应该是内外兼修的,外在的拟人化和内在的拟人化都应该具备,从现在来说,搜狗是走在了行业前端。
对于未来,陈伟表示,接下来搜狗AI主路线是让一个具备表达能力的虚拟人物具备交互能力,这是搜狗分身发展的主路线。未来搜狗将会在整个3D AI合成人物技术下不断地打磨,结合更多的场景做出更自然的表现。例如,不久的将来,AI主播可以到外景去做交互式采访。
据悉,搜狗AI主播的商业化最早落地的是媒体领域和广电领域,陈伟认为媒体领域主播这种类型有一个成熟的流程,即采、编、播、管和存的先后顺序,使得它可以从新闻素材的采集到制作到播放,使用AI合成来顺利完成一个流程化的工作,解放繁琐重复的人工工作。目前搜狗和一些电视台或媒体的渠道商在合作,把AI主播集成到客户的系统。
其次,在金融行业,搜狗已经做出第一个在金融领域落地的AI面审客服:去年在平安普惠APP上线了第一个AI面审客服,把具有交互式AI客服嵌入到平安普惠服务中,现在用户使用平安普惠APP的贷款,可能就是搜狗AI客服在对接。陈伟表示,这项服务已经在平安普惠的客服里面大规模使用了。基于这样的能力,未来也会带动搜狗在金融领域里快速普及。
陈伟坦言,未来3D AI虚拟人物在更多领域具备发展空间,因为它的灵活性和可控性,使得搜狗可以在更多场景下做很多事情,例如,医疗健康、教育、金融和泛娱乐行业,面向大众的行业都可以使用。