“让AI训练AI”论文入选CVPR 2020
“让AI训练AI”论文入选CVPR 2020
不久前,人力资源社会保障部等3部门联合向社会发布了16个新职业,“人工智能(AI)训练师”位列其中。近日,浙江大学与阿里安全的研究团队开发出“AI训练师助手”,可帮助AI训练师高效打造AI模型。目前,阐释这种让AI训练AI、提升模型生产效率的论文被计算机视觉顶会——2020年IEEE国际计算机视觉与模式识别会议(CVPR 2020)接收(Oral)。
据介绍,为应对海量应用场景的增加,该AI训练师助手可让AI训练模型面对新场景时不用从头学习,直接从已经存在的模型上迁移,从而迅速获得别人的知识和能力,成为全新的AI模型,将模型生产周期从一个月缩短为一天。
阿里安全图灵实验室高级算法专家析策认为,与大数据相似,海量模型形成的“模型仓库”也蕴含着巨大的价值——这些预训练的深度模型已消耗了大量训练时间、计算资源以及大规模高质量的标注数据,如果这些预训练的模型能够被合理使用,那么针对新场景的模型训练对时间以及数据的依赖就会显著降低。
“就像你要打造一辆能快速穿越雪地的车,不用从头开始设计,可采用跑车的动力引擎设计,也可改装坦克的履带传动。”析策说。
目前实现这一目标最流行的方法是迁移学习。浙江大学和阿里安全组成的研究团队发现,两个预训练深度模型所提取的特征之间的迁移能力可由它们对应的深度归因图谱之间的相似性来衡量。而且,相似程度越高,从不同的预训练深度模型中获得的特征相关性就越大,特征的相互迁移能力也就越强。
由此着手,研究团队开发了“AI训练师助手”。
同时,“AI训练师助手”还知道从什么模型迁移知识、用模型的哪部分迁移能更好地完成任务。也就是说,他们发现了让“小白模型”向AI深度模型学习的高效学习方法。
以视频内容的筛查为例。当前,视频、直播等内容创作形式的高自由度给内容消费带来了许多潜在安全威胁,AI深度模型也被大规模用于多媒体内容的识别、检测、理解上,以“狙击”含有不良内容的传播。而要提升检测的准确性,面向不同场景必须使用不同的AI模型。“AI训练师助手”的出现,为高效生产不同的AI 深度模型提供了新的选择。
基于对“AI训练师助手”习得最优迁移效果的阐述,该论文被CVPR 2020接收并邀请口头报告。
“在这种方法的指导下,单个AI模型的生产周期从1个月降到1天,我们就能更快地发现不同的内容风险。”析策希望,欺凌、色情、暴力、误导等不良内容不会成为人们消费大量图像视频内容付出的代价,AI 技术可以更快地把不良内容挡在第一线。
相关论文信息:https://arxiv.org/abs/2003.07496
版权声明:凡本网注明“来源:中国科学报、科学网、科学新闻杂志”的所有作品,网站转载,请在正文上方注明来源和作者,且不得对内容作实质性改动;微信公众号、头条号等新媒体平台,转载请联系授权。邮箱:shouquan@stimes.cn。