Lyra 1.3 发布,谷歌开源的语音编解码器


Lyra 1.3 现已发布。此版本提高了速度并减少了模型的存储空间。如果不需要重用早期版本的 bitstream,官方建议所有用户升级。

Lyra 是谷歌去年开源的低比特率语音编解码器,与开放的 AV1 编解码器相结合,可以在 56kbps 的连接上实现语音聊天。Lyra 利用机器学习和其他技术来实现可在 3kbps 下运行的极低比特率语音压缩。

具体更新内容包括:

New Features

  • 新 model 缩小了 43%(TFLite model size),速度提高了 20%(在 Pixel 6 Pro 上将 1.2.0 和 1.3.0 相比)。这是通过存储一些权重并以 8 位整数而不是 32 位浮点数执行算术运算来实现的。由于量化意识训练,更小更快的模型的音频质量与以前的模型一样好——谷歌自己的 listening tests 表明,用户对这个模型或以前的模型都没有偏好。不过由于权重的变化,bitstream 与之前的模型不同。

Breaking Changes

  • 1.3.0 版本的 bitstream 与 1.2.0 不兼容。

更新说明:https://github.com/google/lyra/releases/tag/v1.3.0


相關推薦

2022-10-09

Lyra 是谷歌去年开源的低比特率语音编解码器,与开放的 AV1 编解码器相结合,可以在 56kbps 的连接上实现语音聊天。Lyra 利用机器学习和其他技术进行极低比特率的语音压缩,可以在 3kbps 的速度下运行。 谷歌去年正式开源 Lyra

2022-10-04

。最新消息指出,新版本似乎将强制所有设备使用 AV1 编解码器。此前,设备只需要支持 VP8 和 VP9(AV1 的前身),谷歌希望依赖 AV1 以节省带宽和存储空间。不仅如此,一些使用 Android 14 的设备似乎还将被迫支持 64 位应用程序。

2023-04-18

SON 输出的选项 readme:添加 react-native 绑定 xcodeproj : 在发布模式下添加 O3 -DNDEBUG 在 README 中包含 R 包装器的链接 …… 更多详情可查看:https://github.com/ggerganov/whisper.cpp/releases/tag/v1.3.0

2022-09-14

FLAC 是 Free Lossless Audio Codec 的缩写,它可以减少存储数字音频信号所需的存储空间,而不需要在此过程中删除信息。 由该软件读取和产生的文件被称为 FLAC 文件。由于这些文件(遵循 FLAC 格式)也可以被其他软件读取和写入,

2023-10-25

,桌面版 Chrome 浏览器中计划淘汰并移除对 Theora 视频编解码器的支持。“Theora 的使用率很低(现在还经常出现错误),对大多数用户来说已不再需要支持。” 针对媒体编解码器的零日攻击激增。 UKM 的使用率已降至可测量

2023-11-03

继谷歌计划从 Chrome/Chromium 浏览器中移除对 Theora 编解码器格式的支持之后,Mozilla 也计划采取类似举措,逐步将 Theora 从 Firefox 中淘汰。 目前,Theora 约占 Firefox 媒体资源负载的约 0.09%。开发者 Paul Adenot 指出,拥有大量 Theora 内

2022-10-02

域是 Amazon IVS (Amazon Interactive Video Service),被用于视频编解码器,允许独立于用户浏览器的编解码器支持的一致视频解码。其次是一个 npm 模块 Hyphenopoly,它为 CSS hyphenation 提供了一个 polyfill;核心算法是以的 WebAssembly 模块提供的

2023-03-22

好足够低,甚至是免费。高通最近的一项举措就为 aptX 编解码器得到更广泛的使用打下了一个基础,那就是开源。 Android 专家 Mishaal Rahman 发现,在去年 11 月,高通的工程师就向 AOSP 提交了代码,提交内容显示,高通向 AOSP 添加

2022-03-18

谷歌 Chrome OS 提供了一个内置的屏幕录制软件,不过自带的录屏软件只有“录制整个屏幕/部分屏幕/切换窗口”三个功能。但外媒  发现: 谷歌似乎正在开发一种具有更多功能的全新屏幕录制器。 Chrome Story 在 Chrome OS Canary 频

2022-12-20

了 credentialsResolver 设置 Breaking change 默认编解码器更改为 Kryo5Codec Fixed 在PubSub 订阅尝试之间未发现新的 Redis 节点 codec,nettyHook,addressResolverGroupFactory,connectionListener 设置无法通过 Micronaut 配置定义 evictions metrics

2024-01-11

框架的支持, 现在还可以使用 Javascript 编写全局的的编解码器了。 有些序列化框架需要指定模式(Schema、IDL)文件才能正确进行序列化(编码)和反序列化(解码), 例如 Protobuf、Avro。这一类的编解码器使用前需要用户在文件->编解

2023-11-16

公告写道,这是 VLC 3.0 分支的中度更新:它升级了编解码器,修复了 FLAC 的质量问题,并改进了多种格式的播放,包括改进字幕渲染。它还修复了使用逐帧操作时的冻结问题。在 macOS 上,音频布局问题也得到了解决。 更新

2023-09-08

、JSON、XML、HEX 和 Base64 常规消息编解码,支持 SPI 扩展编解码器; 主界面截图 仓库地址: https://github.com/ptma/mqtt-insight https://gitee.com/ptma/mqtt-insight 下载地址: https://gitee.com/ptma/mqtt-insight/releases/tag/V1.0.0

2022-12-02

英特尔工程师发布了最新的 “2022Q3”以及 “2022Q41 RC1”   FFmpeg 补丁集,最新的补丁用于改进 FFmpeg 视频加速与英特尔图形,存放在英特尔的“cartwheel-ffmpeg” 仓库中。 “cartwheel-ffmpeg”仓库是英特尔开发者的暂存区,