用人工智能技术保护方言(2)
程坤介绍说,现在已经有63万人上传了超过110万条与文字对应的方言发音,这也帮助科大讯飞实现了23种方言的识别和11种方言的语音合成,基本上覆盖了中国主要的方言地区。
然而,正所谓“百里不同俗,十里不同音”,相比于中华民族广袤的地域文化传承和积累,仅“基本覆盖”还远远不够。
“现阶段,一地不同的方言之间的个性化差异,很多情况下只能暂时以一定的鲁棒性将其划分为一种方言,我们希望通过方言保护计划,动员更多的力量可以做的更精细一些。”程坤说,这一方面需要不同方言的语料支持,另一方面需要更多语言文字研究者从规律上、语言本质上发掘不同方言之间的异同。
这意味着,相对于已完成的工作,未来方言保护要走的路仍将是一项巨大的系统工程。
程坤告诉记者,希望更多高校和研究机构中研究学者、各地方言保护的社会团体、民间的语言爱好者、以及广大方言使用者通过方言保护计划,形成一股方言保护的合力。
进一步焕发方言生命力
方言保护之后,如何进一步焕发生命力?程坤认为,利用人工智能不仅能够实现方言的永久留存,也为传承和发扬方言文化提供了更多可能。
“我们可以把方言识别、合成等能力开放出来,让更多合作伙伴开发出各种方言智能语音产品,在解决方言用户沟通障碍的同时,打破场景限制,让方言延伸向更多的文化娱乐领域。”程坤说,讯飞正逐步将相关技术开放出来,供开发者调用。
“我们希望通过自己在方言保护做出的实际行动,呼吁更多的专家学者、方言爱好者、普通用户加入到方言保护计划中来,大家一起携手去传承、感受方言文化。”程坤说。
版权声明:凡本网注明“来源:中国科学报、科学网、科学新闻杂志”的所有作品,网站转载,请在正文上方注明来源和作者,且不得对内容作实质性改动;微信公众号、头条号等新媒体平台,转载请联系授权。邮箱:shouquan@stimes.cn。