一键式 RWKV RAG、RWKV-Keras、新论文...RWKV 社区 7 月动态速览!


大家好,《RWKV 社区最新动态》迎来了第三期内容,本期统计了 RWKV 社区 7 月的重要动态,一起来看看吧!

省流版本:

  1. RWKV 官方公告
    • RWKV-6-World 14B 模型已发布
    • RWKV 中文官网 rwkv.cn 正式上线
  2. RWKV 社区新项目
    • RWKV RAG:一键式 RWKV RAG 本地搭建项目,实现了最小封装和极高的扩展性
    • RWKV-Keras:RWKV 的 Keras 实现,支持 RWKV 模型和 State 的推理和训练
    • rwkv6-keras-operator:RWKV6 模块的 RWKV 核算子,已发 PIP 包
    • RWKV Runner:更新版本并启动易用性改版计划,正在招募前端贡献者
  3. RWKV 的新学术研究:
    • GoldFinch:RWKV/Transformer 混合模型架构
    • Restore-RWKV:RWKV 医学图像修复模型
    • Decision-RWKV:基于 RWKV 模型的机器人终身学习算法
  4. 8 月预告:RWKV 的小说微调模型(7B、14B)正在训练中,有望在 8 月发布!

RWKV 官方动态

RWKV-6-World 14B 开源发布

2024 年 7 月 19 日,RWKV 开源基金会宣布正式向全球开源 RWKV-6-World 14B 模型。

RWKV-6-World 14B 是迄今最强的稠密纯 RNN 大语言模型。在最新的性能测试中,该模型英文性能相当于 Llama2 13b。在同参数的模型评测中,RWKV-6-World 14B 的多语言性能显著最强,且支持全球 100+种语言和代码。

在“无法作弊的模型评测” Uncheatable Eval 排行榜中,RWKV-6-World 14B 的综合评测分数比 llama2 13B 和 Qwen1.5 14B 更强。

RWKV 中文官网正式上线

RWKV 中文官网(rwkv.cn)正式上线了,RWKV 中文官网目前有四大板块,分别是首页、生态页、资讯页,以及 RWKV 中文文档页面。

你可以在 RWKV 中文官网找到关于 RWKV 的绝大多数信息,包括但不限于 RWKV 架构的介绍、RWKV 多模态等研究和相关论文、RWKV 的本地部署和推理教程、RWKV 的全参/微调训练教程,以及 RWKV 最新新闻动态等信息。

RWKV 社区的新项目/更新

RWKV RAG 项目

RWKV_RAG 是 RWKV 的本地 RAG 项目,实现了傻瓜式的本地 RWKV RAG 系统搭建流程。

RWKV_RAG 架构实现了实现了最小封装和高扩展性:所有功能异步化且无封装,想怎么调接口就怎么调接口。

此外,RWKV_RAG 已支持带图形化界面的 LoRA、State tuning、Pissa 等主流 RWKV 微调方法,可以一键微调以适应任何下游任务。

RWKV_RAG 很快会适配多模态和知识图谱功能,敬请期待!

RWKV-RAG 仓库地址: https://github.com/AIIRWKV/RWKV_RAG

RWKV6-Keras

RWKV6-Keras 项目是基于 RWKV 模型的 Keras 实现,由 RWKV 社区的 infiy-quine 兴趣组牵头开发,基于 bert4keras3 和 RWKV6_Keras 算子两个项目。

除了支持训练和推理 RWKV 模型,RWKV6-Keras 还支持 RWKV State 的训练和推理。

以下是 RWKV6-Keras 基于不同后端的生成速度对比:

前置条件 torch(keras) jax(keras) tensorflow(keras) RWKV-Pytorch
有 cuda 算子(bs=1) 4 token/s 78.0 token/s / /
无 cuda 算子(bs=1) 4 token/s 77.0 token/s 77.0 token/s 25.75 tokens/s
有 cuda 算子(bs=64) / 1500.0 token/s / /
无 cuda 算子(bs=64) / 1289.0 token/s / 578.68 tokens/s
prefill(有 cuda) 185ms 5ms / /
prefill(无 cuda) 6s 209ms 186ms 480 ms

对比测试显示,更推荐使用 jax 作为 RWKV6-Keras 后端,以获得最佳性能。

RWKV6-Keras 模型下载:https://www.modelscope.cn/models/q935499957/RWKV6-1.6B-Keras

rwkv6-keras-operator 项目

rwkv6-keras-operator 是一个适用于 bert4keras3 库中 RWKV6 模块的 RWKV 核算子,这个算子在 jax、pytorch 框架提供了原生 CUDA 实现,但对于 TensorFlow 框架只提供基本的上层 api 实现。

  • RWKV6_Keras 算子 pip 包地址:https://pypi.org/project/rwkv6-keras-operator
  • GitHub 仓库:https://github.com/infiy-quine/RWKV6_Keras_Operator

rwkv.cpp 新增 RWKV-6 支持

rwkv.cpp 项目新增了对于 RWKV-6 架构的支持,这意味着 RWKV-6 模型可以在 CPU 上实现较快的推理速度。

详情可见:https://github.com/RWKV/rwkv.cpp/pull/174

在 1.8.5 版本的更新中 ,RWKV Runner 的 rwkv.cpp 模式也同步支持 RWKV-6 架构。

RWKV Runner 项目更新

1. RWKV Runner 发布 1.8.5 版本

RWKV Runner 更新到了 v1.8.5,新版本支持了开发者工具,允许用户自定义头像,并且修复了一些已知问题。

2. RWKV Runner 易用性改版

RWKV Runner 正在启动易用性改版计划,使得软件更开箱即用,对新手更友好。

易用性改版主要围绕前端板块展开,具体任务如下:

RWKV Runner 开发组正在寻找有意向参与改版的前端高手(技术栈 react, typescript, tailwindcss),以加快改版的进度。如果您有意向参与到改版计划,欢迎在“RWKV元始智能”公众号后台留言“改版计划”,我们将第一时间联系您。

Runner API 指南

RWKV 社区发布了关于 RWKV Runner API 的详细用法。文章列出 RWKV Runner 每一个 API 的作用、请求主体的参考结构、必需字段和可选字段等内容,帮助大家更轻松、更灵活地调用 RWKV Runner 的 API。

Runner API 使用指南:https://mp.weixin.qq.com/s/ZU9vpBa6cRMe-0PmrZkJew

RWKV 学术研究相关

格灵深瞳开源 RWKV-CLIP 模型

格灵深瞳近日在 WiseModel 平台上开源了 RWKV-CLIP 模型,RWKV-CLIP (Contrastive Language-Image Pre-training)是一个 RWKV 驱动的视觉语言表示学习模型,该框架可以利用大型语言模型(LLMs)来合成和细化基于网络的文本、合成标题和检测标签的内容。

  • RWKV-CLIP 模型下载:https://wisemodel.cn/models/deepglint/RWKV-CLIP/file

RWKV-CLIP 更多链接:

  • RWKV-CLIP GitHub 仓库:https://github.com/deepglint/RWKV-CLIP
  • RWKV-CLIP 论文地址:https://arxiv.org/abs/2406.06973

Restore-RWKV

Restore-RWKV 是首个基于 RWKV 的医学图像修复模型。文章提出了一种循环 WKV(Re-WKV)注意力机制,该机制以线性计算复杂度捕获全局依赖关系。Restore-RWKV 在各种医学图像修复任务中均具有卓越的性能,包括 MRI 图像超分辨率、CT 图像去噪 PET 图像合成和一体化医学图像修复。

相关链接:

  • Restore-RWKV 论文地址:https://arxiv.org/abs/2407.11087
  • Restore-RWKV GitHub 仓库:https://github.com/Yaziwel/Restore-RWKV

GoldRWKV

GoldFinch 是一种 RWKV/Transformer 混合序列模型,将新的 GOLD transformer 叠加在 Finch(RWKV-6) 架构的增强版本之上,有效地在线性时间和空间中生成高度压缩和可重用的 KV-Cache。相对于 1.5B 参数的 Finch 和 Llama 模型而言,GoldFinch 的建模性能显着提高。

相关链接:

  • GoldFinch 论文地址:https://arxiv.org/abs/2407.12077
  • GoldFinch GitHub 仓库:https://github.com/recursal/GoldFinch-paper

Decision-RWKV

南方科技大学的研究团队提出了 Decision-RWKV (DRWKV) 模型,并将经验回放(experience replay)的概念与 Decision-RWKV 模型相结合,设计出适合机器人的终身学习算法。

实验结果显示 DRWKV 模型在单任务测试和终身学习场景中拥有先进的性能。与此同时, Decision-RWKV 相比 DT(Decision-Transformer)显著地减少了推理时间和内存占用,使其成为现实应用(尤其是机器人领域)的更佳选择。

相关链接:

  • Decision-RWKV 论文地址:https://arxiv.org/abs/2407.16306
  • Decision-RWKV GitHub 仓库:https://github.com/ancorasir/DecisionRWKV

8 月预告

RWKV 小说模型

据可靠消息,专用于写小说的 RWKV 小说微调模型(7B、14B)正在训练中,敬请期待!

关于《RWKV 社区动态》栏目

《RWKV 社区动态》栏目会不定期播报 RWKV 社区的最新消息,以帮助 RWKV 的关注者、爱好者、开发者更好地了解 RWKV 的发展情况。

《RWKV 社区最新动态》不定期更新,所以请保持关注我们的微信公众号(RWKV 元始智能)、QQ 频道(RWKV)等公开平台,以获取最新的消息。

加入 RWKV 社区

RWKV 是一种创新的深度学习网络架构,它将 Transformer 与 RNN 各自的优点相结合,同时实现高度并行化训练与高效推理。

RWKV 模型架构论文:

  • RWKV-5/6(Eagle & Finch): https://arxiv.org/abs/2404.05892

  • RWKV-4:https://arxiv.org/abs/2305.13048

欢迎大家加入 RWKV 社区,可以从 RWKV 中文官网了解 RWKV 模型,也可以加入我们的 QQ 频道和群聊,一起探讨 RWKV 模型。

  • RWKV 中文官网:https://rwkv.cn/
  • QQ 频道:https://pd.qq.com/s/9n21eravc

相關推薦

2024-07-30

4.05892 RWKV-4:https://arxiv.org/abs/2305.13048   加入 RWKV 社区 欢迎大家加入 RWKV 社区,可以从 RWKV 中文官网了解 RWKV 模型,也可以加入我们的 QQ 频道,一起探讨 RWKV 模型。 RWKV 中文官网:https://rwkv.cn/ QQ 频道:https://pd.qq.co

2023-04-28

以视为一个纯 Go 包使用,无需任何外置依赖,可以通过一键go install即可完成安装使用。 命令行 KCL Go SDK快速体验 KCL Go SDK提供了一个自带的 KCL Go 命令行,支持用户通过go install来一键安装 kclvm 的 Go 命令行工具 kcl-go,其要求本

2024-07-05

告数据的语义结构。它以分层方式检测密集连接节点的 "社区",在从高级主题到低级主题的多个层次对图进行分割。 使用 LLM 对这些社区中的每一个进行总结,就能创建数据的分层总结,从而提供数据集的概览,而无需事先知

2023-02-16

XWayland 开发团队公布了 23.1 的发布日程,他们将在 3 月底之前发布 XWayland 23.1 作为下一个功能版本。 Red Hat 工程师 Olivier Fourdan 再次负责管理下一个 XWayland 功能发布。他希望在本周晚些时候为 XWayland 23.1 代码创建分支,下周发

2024-08-14

绑定 在开源投入上,云搜索团队很早就参与了开源 ES 社区的建设。字节跳动内部很早就使用开源版 ES 用于支撑包括抖音、巨量引擎等核心业务,随着集团业务的发展,业务部门对多模态检索有使用需求,云搜索团队发现这些

2024-08-03

图科技有限公司(以下简称“言图科技”),签署openKylin社区CLA(Contributor License Agreement 贡献者许可协议),正式加入openKylin开源社区。 言图科技,专注于大语言模型、自然语言处理以及私域知识库产品的研发与应用的高新

2024-09-30

业的最强大脑。 MaxKB开源项目自2024年3月发布至今在开源社区表现出了卓越的成长性。目前,MaxKB已经在代码托管平台GitHub上获得超过10,000个Star和超过1,300次Fork,全网累计下载数量超过200,000次,项目正在被广泛应用于企业内部

2023-08-17

s (NodeJS)、redis-py (Python)、NRedisStack (.Net) 和 Go-Redis (Go))的社区维护人员直接合作,建立文档、用户界面、治理和安全性等方面的一致性。还在 Redis Stack 和 Redis Enterprise(云和软件)中支持 RESP3 协议。 让 Redis 对开发人员来

2024-07-07

github.com/1Panel-dev/MaxKB)。MaxKB开源项目发布后迅速获得了社区用户的认可,成功登顶GitHub Trending趋势榜主榜。 截至2024年7月4日,MaxKB开源项目的下载量已经突破了10万次大关,获得的GitHub Star数超过7,800个。来自开源社区的积极反

2024-08-02

,实时更新和个性化定制存在一定的挑战。 Mem0 则能够动态适应用户的变化需求,实时更新记忆库,确保每次交互都基于最新的信息。这使得 Mem0 在提供个性化推荐和响应方面更具优势​。 更具体来说: Mem0 核心能力 用

2024-07-17

Stonebraker 和 CMU 知名教授 Andrew Pavlo (Andy)教授创作的最新论文《What Goes Around Comes Around...And Around...》,标题着实特别,“What Goes Around Comes Around”中文翻译过来是「种瓜得瓜,种豆得豆」、「因果报应」。而后面的 Around,暗示

2024-05-18

5月17日上午,在腾讯生成式AI产业应用峰会上,腾讯副总裁、腾讯混元大模型负责人蒋杰透露称,将在今年三季度开源混元最核心的文生文模型。 蒋杰称,腾讯内部正在训练三种尺寸(S、M、L)的文生文模型供开源使用, S

2023-11-10

CL 导入工具发布 - 支持从 YAML/JSON/CRD/Terraform Schema 一键生成 KCL 配置/模型,实现自动化迁移   |特别鸣谢|   以下排名不分先后 感谢 @jakezhu9 对 KCL benchmark 由单线程 Rc 到 Arc 的改进,对 KCL

2023-02-11

份」操作记录 rpm/deb 包中内置 dashboard.service 脚本,可一键启停 Dashboard 服务及查看 Dashboard 版本信息; 支持导入并监控依赖服务; 新增产品问题反馈入口:遇事不慌,戳下入口即可提问召唤技术人员; 优化 支持企业