Lyra 1.3 发布,谷歌开源的语音编解码器


Lyra 1.3 现已发布。此版本提高了速度并减少了模型的存储空间。如果不需要重用早期版本的 bitstream,官方建议所有用户升级。

Lyra 是谷歌去年开源的低比特率语音编解码器,与开放的 AV1 编解码器相结合,可以在 56kbps 的连接上实现语音聊天。Lyra 利用机器学习和其他技术来实现可在 3kbps 下运行的极低比特率语音压缩。

具体更新内容包括:

New Features

  • 新 model 缩小了 43%(TFLite model size),速度提高了 20%(在 Pixel 6 Pro 上将 1.2.0 和 1.3.0 相比)。这是通过存储一些权重并以 8 位整数而不是 32 位浮点数执行算术运算来实现的。由于量化意识训练,更小更快的模型的音频质量与以前的模型一样好——谷歌自己的 listening tests 表明,用户对这个模型或以前的模型都没有偏好。不过由于权重的变化,bitstream 与之前的模型不同。

Breaking Changes

  • 1.3.0 版本的 bitstream 与 1.2.0 不兼容。

更新说明:https://github.com/google/lyra/releases/tag/v1.3.0


相關推薦

2022-10-09

Lyra 是谷歌去年开源的低比特率语音编解码器,与开放的 AV1 编解码器相结合,可以在 56kbps 的连接上实现语音聊天。Lyra 利用机器学习和其他技术进行极低比特率的语音压缩,可以在 3kbps 的速度下运行。 谷歌去年正式开源 Lyra

2022-10-04

。最新消息指出,新版本似乎将强制所有设备使用 AV1 编解码器。此前,设备只需要支持 VP8 和 VP9(AV1 的前身),谷歌希望依赖 AV1 以节省带宽和存储空间。不仅如此,一些使用 Android 14 的设备似乎还将被迫支持 64 位应用程序。

2023-04-18

SON 输出的选项 readme:添加 react-native 绑定 xcodeproj : 在发布模式下添加 O3 -DNDEBUG 在 README 中包含 R 包装器的链接 …… 更多详情可查看:https://github.com/ggerganov/whisper.cpp/releases/tag/v1.3.0

2022-09-14

FLAC 是 Free Lossless Audio Codec 的缩写,它可以减少存储数字音频信号所需的存储空间,而不需要在此过程中删除信息。 由该软件读取和产生的文件被称为 FLAC 文件。由于这些文件(遵循 FLAC 格式)也可以被其他软件读取和写入,

2023-10-25

,桌面版 Chrome 浏览器中计划淘汰并移除对 Theora 视频编解码器的支持。“Theora 的使用率很低(现在还经常出现错误),对大多数用户来说已不再需要支持。” 针对媒体编解码器的零日攻击激增。 UKM 的使用率已降至可测量

2023-11-03

继谷歌计划从 Chrome/Chromium 浏览器中移除对 Theora 编解码器格式的支持之后,Mozilla 也计划采取类似举措,逐步将 Theora 从 Firefox 中淘汰。 目前,Theora 约占 Firefox 媒体资源负载的约 0.09%。开发者 Paul Adenot 指出,拥有大量 Theora 内

2024-07-24

RustDesk 1.2.7 版本发布,https://github.com/rustdesk/rustdesk/releases/tag/1.2.7 新加 共享剪贴板支持图像 (#8561, video) 提供 Linux 下的 Sciter 版本,以便不兼容 Flutter 的老机器还可以跑 (#8545) 免安装版本增加启动窗口 (#8490) 自定义

2022-10-02

域是 Amazon IVS (Amazon Interactive Video Service),被用于视频编解码器,允许独立于用户浏览器的编解码器支持的一致视频解码。其次是一个 npm 模块 Hyphenopoly,它为 CSS hyphenation 提供了一个 polyfill;核心算法是以的 WebAssembly 模块提供的

2024-07-11

setCodecPreferences 方法允许应用程序禁用特定编解码器(包括 RTX/RED/FEC)的 negotiation。它还允许应用程序使远程对等端优先选择列表中最先出现的编解码器进行发送。 图像和文档的 Accept header 已被更改,以便更

2023-03-22

好足够低,甚至是免费。高通最近的一项举措就为 aptX 编解码器得到更广泛的使用打下了一个基础,那就是开源。 Android 专家 Mishaal Rahman 发现,在去年 11 月,高通的工程师就向 AOSP 提交了代码,提交内容显示,高通向 AOSP 添加

2022-12-20

了 credentialsResolver 设置 Breaking change 默认编解码器更改为 Kryo5Codec Fixed 在PubSub 订阅尝试之间未发现新的 Redis 节点 codec,nettyHook,addressResolverGroupFactory,connectionListener 设置无法通过 Micronaut 配置定义 evictions metrics

2024-01-11

框架的支持, 现在还可以使用 Javascript 编写全局的的编解码器了。 有些序列化框架需要指定模式(Schema、IDL)文件才能正确进行序列化(编码)和反序列化(解码), 例如 Protobuf、Avro。这一类的编解码器使用前需要用户在文件->编解

2024-10-22

资金追踪机构 PitchBook 最新发布的一份数据指出,2024 年第三季度,风险投资公司在 206 笔交易中向生成式 AI 初创公司投资了 39 亿美元(这还不包括OpenAI的 66 亿美元融资),其中有 127 笔交易涉及 29 亿美元流向了美国公司 。 一

2022-03-18

谷歌 Chrome OS 提供了一个内置的屏幕录制软件,不过自带的录屏软件只有“录制整个屏幕/部分屏幕/切换窗口”三个功能。但外媒  发现: 谷歌似乎正在开发一种具有更多功能的全新屏幕录制器。 Chrome Story 在 Chrome OS Canary 频