潘云鹤:“视觉知识”将推动AI 2.0的突破(2)
潘云鹤:视觉知识体系构建与利用需要解决的首要问题是视觉知识学习,这也是一个知识学习的无人区。建立一个系统的知识体系,往往更需要自顶向下的设计,在这个过程中,诸如3D形状重建等计算机视觉研究成果为系统的视觉知识学习提供了发展土壤。
不过,视觉知识学习要将目标从视觉形状重建进一步深入到视觉知识重建,还需要对现有计算机视觉技术作进一步研究,比如:重建3D形状的层次结构,定位其在概念范畴中的位置等。
除了视觉概念,还要研究视觉命题与视觉叙事的表达和学习。
《中国科学报》:视觉知识有哪些应用?
潘云鹤:从当前AI热潮中视觉识别技术的广泛渗透,可推知视觉知识的应用极广。这里我举三个例子,说明视觉知识的各种应用。
第一,基于知识的识别方法,如用于图像识别。例如“猫”,根据“猫”的视觉概念的典型与范畴等,使用综合推理方法自动生成猫的范畴内外各种图像大数据,并根据范畴内外自动标识为正、负范例。然后,用上述范例大数据训练多层神经网络,最后,用训练过的多层神经网络识别图像。
第二,基于知识的3D重建方法,例如身体的3D重建。将标准身材知识按测量特征点加以变化,从而形成个性化身材的3D重建。
第三,基于知识的创作,即视觉知识用于设计。例如设计人物角色时,在动画、游戏、绘画、广告应用中都有需要。
事实上,视觉知识有着独特的优点:能够提供综合生成能力、时空比较能力和形象显示能力,而这些正是字符知识所缺乏的重要能力。它们能在创造、预测和人机融合等方面对AI新发展提供新的基础动力。
《中国科学报》:关于视觉知识,未来,我们需要关注的重点还有哪些?
潘云鹤:建设视觉知识词典将是十分重要的,这是一个巨大而实用的知识平台和数据平台,应当联合全球人工智能、计算机图形学和计算机视觉科技工作者共同建设。为了顺利而高效地完成视觉知识词典的建设,群智组织模式也将不可或缺。
版权声明:凡本网注明“来源:中国科学报、科学网、科学新闻杂志”的所有作品,网站转载,请在正文上方注明来源和作者,且不得对内容作实质性改动;微信公众号、头条号等新媒体平台,转载请联系授权。邮箱:shouquan@stimes.cn。