易商讯
当前位置: 首页 » 网络 » 物联网 » 正文

Meta已开发闽南语AI翻译,解决非文字语言翻译难题

放大字体  缩小字体 发布日期:2022-10-21 11:21:05
导读

  近日,Meta宣布推出口语翻译系统,Meta CEO扎克伯格在facebook上发布demo影片,首次在线上通过该翻译系统和员工对话。  在demo影片中,扎克伯克说英文,来自台湾的Meta工程师用闽南语,通过该口语翻译系统,两人无障碍交流,且翻译都非常地道。  Meta称,将闽南语翻译成英语的这套系统,是第一个由AI驱动的为非文字

  近日,meta宣布推出口语翻译系统,meta CEO扎克伯格在facebook上发布demo影片,首次在线上通过该翻译系统和员工对话。
   在demo影片中,扎克伯克说英文,来自台湾的meta工程师用闽南语,通过该口语翻译系统,两人无障碍交流,且翻译都非常地道。
   meta称,将闽南语翻译成英语的这套系统,是第一个由AI驱动的“为非文字语言开发的语音翻译系统”。
   在全球范围内,有许多语言和闽南语一样,有人使用,但没有标准化的书写方式,而AI翻译系统需依靠大量的可标签范例,像是口语标签或字符,才能把资料“喂”给机器学习。
   meta的研究团队称:“我们利用普通话作为中间语言来建立伪标签,我们首先将英语(或闽南语)语音翻译成普通话文本,然后我们再翻译成闽南语(或英语),并将其加入训练数据。”
   目前,该系统允许讲闽南语的人与讲英语的人交谈,尽管很生硬。该模型一次只能翻译一个完整的句子,但扎克伯格相信,这项技术最终可以应用于更多语言,并将改进到提供实时翻译的程度。
   meta宣布,他们将开放大型语料库,让研究人员可以为更多“无法书写的语音”建立翻译系统。业内人士认为,良好的翻译工具对于元宇宙的开发不可少。
   【开源AI模型,精准翻译超200种语言】
   今年7月,meta公司宣布将免费开源旗下AI系统NLLB-200 ,该系统是全球第一个能翻译200种不同语言的单一AI模型,将为超过10亿人提供高品质翻译内容。
   meta公司称,将会把NLLB-200对外开源,同时向非营利机构提供20万美元的资助,以开发该技术应用于更多应用程式上。
   德国慕尼黑大学计算机语言学家Alexander Fraser认为,该模型的主要贡献在于数据,包含了100种全新语言。
   目前,市面上很多翻译工具并不支持冷门的语言,也就是少于百万人口使用的语言,而NLLB-200解决了这个问题。
   【"不遗漏任何语言"】
   全球有数十亿人,但一直以来却没有可以翻译上百种语言的高品质翻译工具,他们无法通过自己惯用的语言或母语浏览网络上的内容,或在网络社群上参与讨论,尤其是对于非洲、亚洲等地区有高达数亿人使用不同种类的语言。
   为了突破网络上的语言障碍,并促进元宇宙发展,meta的AI研究人员早年已成立NLLB专案,开发AI模型为全世界提供高品质的翻译功能。
   据悉,NLLB是“No Language Left Behind(不遗漏任何语言)”的缩写,该AI系统可以高质量翻译世界上多达200种语言,除了主流语言外,其中还包含多达55种非洲系语言及其他少数语言。
   在多项指标中,相较现有的其他翻译工具,NLLB-200的翻译品质平均高出44%。在部分非洲和印度语言中,提升幅度相较最新的翻译系统更提升了70%。
   此外,meta也与维基基金会合作,希望NLLB-200之后可以提供维基百科翻译的服务,改善维基百科的翻译系统。通过双方的合作,NLLB-200持续学习其他翻译器中无法翻译的语言,AI模型可以自己学习语言中的文字系统,得到更准确的翻译结果。
   可以想象的是,“通用语音翻译系统”一旦在元宇宙中实现,可以让全世界不同语种的用户,在元宇宙虚拟空间里沟通、开会、玩游戏,将会比在现实中更加方便,也将更进一步实现meta对发展元宇宙的野心。
 
(文/小编)
免责声明
• 
本文Meta已开发闽南语AI翻译,解决非文字语言翻译难题链接:http://www.esxun.cn/internet/79643.html 。本文仅代表作者个人观点,请读者仅做参考,如若文中涉及有违公德、触犯法律的内容,一经发现,立即删除,作者需自行承担相应责任。涉及到版权或其他问题,请及时联系我们,我们将在24小时内处理完毕。如涉及作品内容、版权等问题,请在作品发表之日起一周内与本网联系,否则视为放弃相关权利。
 

Copyright © www.esxun.cn 易商讯ALL Right Reserved


冀ICP备2023038169号-3