新算法让36年前的指纹“开口说话”

光山新闻网 采集侠 2023-09-19 11:14:01
浏览

原标题:新算法让36年前的指纹“开口说话”

◎本报记者 都 芃

空无一人的渔船搁浅在岸边,6名船员不见踪影,随身携带的货款不翼而飞,舱内残留着血迹……36年前,浙江舟山发生一起特大抢劫杀人案。现场遗留的关键线索之一,是一枚带血的指纹。2022年9月,该案正式宣布告破,两名嫌疑人全部落网。不久前,该案正式一审开庭审理。

一枚血指纹何以让三十余年未获突破的命案真相大白?这背后是北京大学智能学院封举富教授团队历时二十余年攻关,研发出的人工智能指纹识别引擎。该技术自应用以来,已协助警方成功破获数千起案件,实现了我国开放环境下指纹识别技术的飞跃式发展。

初代技术需要迭代升级

目前的理论认为,世界上没有两个指纹相同的人。一枚指纹由数十根弯曲线条组成,每根线条的走向、弯曲程度都千差万别。要识别出两枚指纹的相同或不同,需要日复一日的专业训练和日积月累形成的经验。

北京大学是全球智能学科的诞生地之一,1988年成立了北京大学第一个国家重点实验室——视觉与听觉信息处理国家重点实验室,该实验室在指纹识别等领域处于国际领先水平。

20世纪80年代,中国科学院院士、北京大学教授石青云最先开始将模式识别技术应用于指纹识别,开创了我国指纹识别技术的先河,并在此基础上研发出了我国首个自动指纹识别系统。

2002年,30多岁的封举富接过了接力棒。指纹识别的核心是找到每一枚指纹的特征点,并将其进行标记。系统会将这些标记转化为一串串二进制数字,与系统中已有的指纹数据进行比对。“只要两枚指纹所有的特征点都能对上,我们就认为它是同一枚指纹。”封举富说。

但识别在第一步就卡住了。2003年,封举富带着该技术前往海南协助警方侦办案件。在实际应用中,封举富发现复杂的情况超出他的想象。系统并不能很好地识别、标记出指纹上的特征点,进而导致进行比对时成功率不高。

当地一位做指纹标记的警员对封举富开玩笑:“封老师,您这个还不能叫自动指纹识别,只能算‘半自动’。前期还是得需要我们一个个手动去标嘛。”封举富听了这句玩笑话有些不好意思。“初代技术的效果确实还不够好,还是离不开人工标注。我感到有些羞愧。”

从海南回来后,封举富暗自下定决心,一定要让指纹识别技术摆脱人工限制,成为真正的“全自动”系统。

从半自动走向全自动

科研人员要坐得住冷板凳。封举富的冷板凳,一坐就是10年。从2003年海南之行碰壁后,封举富一头扎进了技术攻关中,但效果却一直没能达到他的设想。封举富感到,常规的技术路线似乎已经触摸到了“天花板”,要想翻越“全自动”这座大山,需要引进新的方法。

2013年,以神经网络学习为代表的人工智能技术快速发展,封举富看到了将其应用于指纹识别的可能。

想法虽好,但该技术在指纹识别领域并无太多应用经验可借鉴,如何应用该技术需要自己摸索。封举富向记者介绍,应用神经网络学习技术,需要用大量标记好的数据对模型进行预训练。“数据库越大、用于学习的资料越多,最后的效果就越好。”但封举富的数据库里只有少量指纹,对于模型训练来说远远不够。不仅数量少,数据质量也参差不齐。“不同的人对指纹标记的结果都不一样,质量有高有低,这也增加了训练的难度。”

数据受限,封举富决定从算法上下功夫。“如果让小孩子去认识小猫小狗或许还可以,但想让他识别指纹,太困难了。”封举富要做的就是要先把小孩子培养成指纹专家,再训练其进行指纹识别,如此只需利用较少的数据量便可达到事半功倍的效果。于是,封举富将他研究十余年的指纹知识,变成了一行行指令,敲进了代码中,原本的“幼儿”成长为了一名指纹专家。