Meta 开发了实时翻译闽南语的 AI


目前大多数的人工智能翻译都集中在翻译书面语言上,因为这些语言具有丰富的数据集,对 AI 而言这也是训练机器学习系统理解和翻译的最简便的方法。然而,全球共有超过 7000 种不同的语言,其中更有超过 40% 的语言是没有标准书写系统的。

来自 Meta(前 Facebook) 的人工智能研究团队就专门针对这种场景开发了一个 AI 翻译系统,这是一个面向口头语言的实时翻译系统,并以闽南语与英文互译为首要目标。

闽南语主要在我国福建和台湾广泛使用,其次在新加坡、印尼、马来西亚等东南亚国家的使用群体也不小。根据 Meta 的统计,目前约有 4600 万人说闽南语。闽南语本身没有标准的书写系统,主要就是通过口语交流。相比传统的 AI 翻译项目,Meta 探索的这个项目显得十分新颖。

这项工作是 Meta AI 的通用语音翻译器项目的一部分,这个机器语言模型的最终目标是允许实时翻译众多不同的口语和书面语言,使任何人都能轻松沟通。

建构新模型的挑战在于,大多数实时翻译技术主要使用书面语言作为语音编码的数据集和注释基础(例如,英语、西班牙语、汉语普通话等有大量使用者的主流语言),因为有更多数据支持,使得挖掘数据和构建大型模型相对简单。

但像闽南语这样的方言,一是没有标准的书写系统,二是使用群体相比主流语言较小。这就使得构建一个庞大的数据模型变得非常困难。研究人员就需要找到一种中间语言来连接两者,在这个过程中他们使用的就是汉语普通话,两者还是有很多相似之处的,能够帮助建立初始模型。

整个翻译过程简化后就是「英语 ⇔ 普通话 ⇔ 闽南语」这样的双向翻译过程,这其中有人类的注释,也有自动翻译的结果,然后研究人员会将配对的句子添加到用于训练人工智能模型的数据中。在这个过程中,研究人员还积极与会说闽南语的人合作,以确保人工智能翻译模型的准确性。

该模型目前仍在开发中,并且只适用于那类具有中间语言可以桥接两个不同语言的语言,如果两个语言之类没有密切相似的可桥接语言的话,将无法使用这个新模型,但该模型仍然为通用翻译开辟了更多的新语言。

Meta 未来将开源这个闽南语的模型、代码、基准数据和论文等资料,供其他人构建自己的 AI 实时翻译工具。Meta AI 的工程师除了希望这个 AI 翻译系统可以帮助用户跨越语言障碍更自如地交谈,还希望可以帮助语言学家保护无文字语言,因为一些没有标准化书面系统的语言正面临着消亡的风险。


相關推薦

2022-07-08

nguage Left Behind)项目取得了突破,能为世界上大多数语言开发出高质量的机器翻译。 该 AI 模型名为 NLLB-200,可以翻译超过 200 种不同的语言。为了评估新模型的输出质量,Meta 创建了一个测试数据集,包括该模型所涵盖的每种

2023-10-28

模型,据称性能超越 Llama 2、比肩 GPT-4,最终目标是加速开发下一代生成式人工智能模型,使其能够生成更多类似人类的表达。 长期以来,Meta 一直在采用开源方法公开其大模型产品,是业内众所周知的最大贡献者之一。仅今

2023-08-25

C BY-NC 4.0 许可下发布,以便研究人员可以在此基础上进行开发。与此同时,Meta 还发布了一个多模式翻译数据集 SeamlessAlign,包含 270,000 小时的语音和文本对齐。  Meta 表示,现有的语音转语音和语音转文本程序仅覆盖世界上

2022-08-22

以驻留在菜单栏中对 CPU、GPU、内存、磁盘和网络等进行实时监测。目前 Stats v2.7.31 发布了 ,此版本带来如下变更: 关闭的问题 功能:睡眠时将风扇模式更改为自动。如果启用“保存风扇速度”(#1002),风扇控制将

2023-09-12

多元共进|2023 Google 开发者大会精彩演讲回顾 根据 Siliconangle 的报道,Meta 正在寻求在生成式 AI 领域与 OpenAI 展开竞争,将发布新的开源大模型,其性能或将与GPT-4 不相上下。 报道称,这款新模型比 Llama 2 强大数倍

2022-11-08

最后,解码器使用单个 CPU 上的神经网络将压缩的数据实时地转变回音频; 至于应用,Meta 表示这种由人工智能驱动的 "超压缩音频" 可以在恶劣的网络条件下获得更快、更优质的通话效果。作为一家 “梭哈” 元宇宙的公司

2024-02-04

1. 促进行业创新: 通过开源AI模型,Meta可以鼓励全球的开发者、研究人员和公司利用这些技术进行创新。这种共享精神有助于加速AI技术的进步,并推动新应用和服务的开发。 2. 提高模型质量: 开源允许更广泛的社区参与到模

2023-02-28

在性能上反而可以超过 GPT-3 模型。更小的模型也意味着开发者可以在 PC 甚至是智能手机等设备上本地运行类 ChatGPT 这样的 AI 助手,无需依赖数据中心这样的大规模设施。 项目成员 Guillaume Lample 表示: 与 Chinchilla、PaLM 或 GPT

2022-10-09

束缚在它们所设计的特定硬件上。这样的硬件锁定意味着开发人员将需要为不同的硬件构建特定的软件,并且很可能也会减缓行业整体创新的步伐。 Meta 日前开源了一套新的 Python 框架,名为 AITemplate(AIT)。它彻底改变了上述

2023-01-12

用外部卷访问的额外步骤和信息 (MAS) 小的错误修复 翻译 更新了简体中文、俄语、越南语、乌克兰语、法语翻译 平台 新推出了 Keka for iOS 版本(售价 $3.99) 更多详情可查看:https://github.com/aonez/Keka/releases

2023-06-09

席 Josh Hawley 近日致信马克·扎克伯格 (Mark Zuckerberg),就 Meta 的大语言模型 LLaMA 泄露一事提出了质疑。 他们担忧该模型可能被滥用于垃圾邮件、欺诈、恶意软件、侵犯隐私、骚扰以及其他不法行为,从而造成伤害。因此在信中质

2022-07-16

共同成立了一个名为 BigScience 的研究小组来领导 Bloom 的开发。该项目汇集了 70 多个国家/地区、250 多个机构、1000 多名研究人员参与开发。 语言模型的开发成本历来很高,以现在知名度很高的 GPT-3 为例,其成本高达 2760 万美元

2023-08-04

喇叭声、脚步等背景音频,或更复杂的音乐,适用于游戏开发、社交、视频配音等业务场景。 根据官网的介绍,MusicGen 接受过 Meta 拥有的和特别授权的音乐训练,可以从文本提示生成音乐,而 AudioGen 接受过公共音效训练,可从

2023-10-26

百度开放文心4.0开发权限申请在2023年百度世界大会上,百度发布了文心大模型4.0,提升了理解、生成、逻辑、记忆等四个方面,现在开发者可以申请使用 ERNIE Bot SDK 开发与接入该模型的应用。申请地址:https://aistudio.baidu.com/communi