
【编者按】科技巨头再次突破语言壁垒!meta公司最新发布的"全语种"AI识别技术,不仅覆盖1600种语言,更将500种濒危方言纳入数字世界。在全球化浪潮中,那些散落在角落的少数民族语言正面临失传危机,而这项技术犹如一座数字方舟,让每种声音都有机会被永久保存。虽然目前对小语种的识别准确率仍有提升空间,但开放源代码的举措已然点燃语言保护的火种。当AI开始聆听最微弱的乡音,我们看到的不仅是技术革新,更是文明延续的曙光。这场无声的语言救援行动,正在重新定义科技的温度。
社交媒体巨头meta公司近日发布了一项突破性人工智能技术,能够识别超过1000种口语语言。
meta基础人工智能研究团队于当地时间10日推出自动语音识别系统,可将包括少数民族语言在内的1600种语言实时转写为文字。这项革命性技术被命名为"全语种"系统。
令人振奋的是,在"全语种"支持的语言中,包含500种"低资源语言"——这些语言因数据匮乏或缺乏技术支撑,此前从未享受过AI转写服务。这与主流AI系统仅支持数十种语言的现状形成鲜明对比。
基于大语言模型的生成式AI在数据丰富的主流语言中表现出色,但在资源稀缺的语种面前却屡屡受挫。更棘手的是,已发布的模型若要新增语言支持,必须经过专家团队的精细调校,流程繁琐耗时。
然而meta透露,"全语种"仅需少量语音-文本配对数据,即可实现基础语音识别功能,这为保护濒危语言带来曙光。
根据公开数据,该系统对低资源语言的文字转写错误率仍显著高于主流语言。在249种高资源语言和881种中资源语言中,95%的语种错误率低于10%,但546种低资源语言中仅有36%达到同等标准。
更值得称赞的是,meta已将"全语种"采用的70亿参数语音编码器开源发布,同时公开350种少数民族语言的语音数据库。这些工具能自动将语音数据转换为AI可理解的向量格式,为全球开发者打开语言保护的新纪元。



