Meta AI 团队宣布开源了一个名为 Massively Multilingual Speech (MMS) 的 AI 模型,声称可以识别 4000 多种语言,比目前已知技术要多 40 倍。以及扩展了文本转语音和语音转文本技术的涵盖范围,从大约 100 种语言到 1100 多种。 根据介绍,现有的最大的语音数据集最多只涵盖 100 种语言;因此为了收集数千种语言的音频数...

新闻来源:Meta 开源大模型:支持 4000+ 语言识别,1100+ 种语音文本转换