首个听障人士声音复原工具免费开放

  近日,网易集团、网易公益联合浙江省残疾人福利基金会发起“人生第一句”声音复原公益计划,利用网易互娱AI Lab的iSpeech技术打造首个AI复原听障人士原声的工具——听障人士仅需上传2分钟没有完整语义的发声片段,之后在产品中输入想要表达的文字,就可以用原本的声音说出来。目前该产品已向全国听障人士免费开放,帮助他们无障碍、有情感地与外界交流,用自己的声音说出“人生第一句”。

  据介绍,作为亚运圆梦计划之一,“人生第一句”公益计划在杭州2022年第4届亚洲残疾人运动会组委会、中国残疾人事业新闻宣传促进会、浙江省残疾人联合会的指导下发起,基于致敬亚运、助力亚残运、助力残障人士社会融合的大背景,通过AI技术帮助听障人士实现“亲口说话”的人生梦想,号召更多人“益”起来关注残障人士,关注无障碍环境建设。

  首个AI声音复原工具,免费开放给全国听障人士

  不久前,浙江省残疾人福利基金会面向浙江特殊教育职业学院的学生和音书APP(拥有百万听障用户)的部分用户开展调研,调研结果显示,仅有十分之一的受访对象能够通过简单的口语与身边的人进行交流,他们中的大多数人经历过太多想说但说不出的自卑与懊恼,最大的梦想便是能说出“人生第一句”。


  是否能运用最新的人工智能技术帮助听障人士向他人传递自己的真实想法和真诚态度?网易互娱AI Lab的技术团队展开了研究。研究发现,目前市场上绝大多数语音克隆产品需要输入完整讲话采集数据,对于无法正常发出语义的听障人士来说并不适用,而且面向听障人士的交流工具,大多也只有文字转语音功能,他们无法用自有的音色表达。


  因此,网易互娱AI Lab研发团队利用iSpeech技术,基于海量数据的预训练模型,加上听障人士极少量的纯语音数据快速微调算法模型,在快速克隆新的说话人音色的同时保留基础模型的内容发音能力,研发首个听障人士声音复原工具,实现只需输入文字就可实时用原声流畅表达,让听障人士能圆梦“人生第一句”。

  目前该声音复原工具已经在音书App上线,供听障人群免费使用,并且在浙江省杭州市马塍路残疾人融合就业街区试点应用,帮助听障咖啡师、面包师等更好地工作。据了解,残疾人融合就业街区也是杭州亚残运会期间对外展示的窗口,有了科技的助力,无声小店的工作人员从被助者变为助人者,便捷流畅地与各方来客交流,为他们提供更好的服务,向世界展示中国残疾人群体的新风貌。

(责任编辑:AK007)