RWKV 社区近期新增科研项目


2024 年 5 月 7 日,我们呼吁大家使用 RWKV-6 替代 Mamba 进行科研。截至 7 月 29 日,来自全球各地的科研团队已经陆续发表了 7 篇基于 RWKV 架构、在各个领域进行深入研究的论文。

新的 RWKV 学术研究主要聚焦于具身智能、图像处理、模型架构三个方面。

机器人/具身智能

Decision-RWKV

  • 论文名称:Optimizing Robotic Manipulation with Decision-RWKV: A Recurrent Sequence Modeling Approach for Lifelong Learning
  • 论文链接: https://arxiv.org/abs/2407.16306
  • 仓库地址: https://github.com/ancorasir/DecisionRWKV

南方科技大学的研究团队提出了 Decision-RWKV (DRWKV) 模型,并将经验回放(experience replay)的概念与 Decision-RWKV 模型相结合,设计出适合机器人的终身学习算法

Decision-RWKV 团队在 OpenAI Gym 环境(使用 D4RL 数据库)和 D'Claw 平台(使用离线数据集)上进行了广泛的实验,以评估 DRWKV 模型在单任务测试和终身学习场景中的性能:

实验结果显示:Decision-RWKV 可有效地处理多个子任务。与此同时, Decision-RWKV 相比 DT(Decision-Transformer)显著地减少了推理时间和内存占用,使其成为现实应用(尤其是机器人领域)的更佳选择。

图像处理

Restore-RWKV

  • 论文名称: Restore-RWKV: Efficient and Effective Medical Image Restoration with RWKV
  • 论文链接: https://arxiv.org/abs/2407.11087

Restore-RWKV 是首个基于 RWKV 的医学图像修复模型。文章提出了一种循环 WKV(Re-WKV)注意力机制,将双向注意力作为全局感受野的基础,并采用循环注意力来模拟来自不同扫描方向的 2D 依赖关系。

其次,Restore-RWKV 团队还开发了一个全向 token 转移(Omni-Shift)层,该层通过从各个方向和在广泛的上下文范围内转移 token 来增强局部依赖性。

 

实验结果表明,Restore-RWKV 在各种医学图像修复任务中均具有卓越的性能,包括 MRI 图像超分辨率、CT 图像去噪、PET 图像合成和一体化医学图像修复。

有效感受野

可视化对比实验

RWKV-SAM

  • 论文名称:Mamba or RWKV: Exploring High-Quality and High-Efficiency Segment Anything Model
  • 论文链接:https://arxiv.org/abs/2406.19369

“RWKV-SAM”(Segment Anything Model)是基于 RWKV 的图像分段切割方法。

与 Transformer 模型相比,RWKV-SAM(图像分割模型) 实现了 2 倍以上的加速,且可以在各种数据集上实现更好的图像分割性能。

此外,RWKV-SAM 的分类和语义分割结果优于最新的视觉 Mamba 模型。

VisualRWKV

  • 论文名称:VisualRWKV: Exploring Recurrent Neural Networks for Visual Language Models
  • 论文链接:https://arxiv.org/abs/2406.13362

VisualRWKV-6 是基于 RWKV 的可视化语言模型,能够处理各种可视化任务。

VisualRWKV-6 的架构设计是 Data-dependent Recurrence + Sandwich Prompt + Bidirectional Scanning 。

与基于 Transformer 的模型(如 LLaVA-1.5)相比,VisualRWKV 在各种基准测试中实现了具有竞争力的性能。

VisualRWKV6 的基准测试

RWKV-CLIP

  • 论文名称:RWKV-CLIP: A Robust Vision-Language Representation Learner
  • 论文链接:https://arxiv.org/abs/2406.06973

RWKV-CLIP 是一个 RWKV 驱动的视觉-语言表示学习模型,该框架在多个下游任务中实现了最先进的性能,包括线性探测、零样本分类,以及零样本图像文本检索。

实验结果显示:与 ALIP 相比,RWKV-CLIP 在图像文本模态空间中表现出更近的距离,表明具有卓越的跨模态对齐性能。

可视化的模态交互

PointRWKV

  • 论文名称: PointRWKV: Efficient RWKV-Like Model for Hierarchical Point Cloud Learning
  • 论文链接: https://arxiv.org/abs/2405.15214

PointRWKV 项目是一种基于 RWKV 的 3D 点云学习框架,在下游点云任务上性能优于基于 Transformer 和 Mamba 的同类工作,显著节省了约 46% 的 FLOPS。

大量实验表明,PointRWKV 优于基于 Transformer 和 mamba 的同类产品,同时展示了构建基础 3D 模型的潜在选择。

混合模型

GoldFinch

  • 论文名称:GoldFinch: High Performance RWKV/Transformer Hybrid with Linear Pre-Fill and Extreme KV-Cache Compression
  • 论文链接:https://arxiv.org/abs/2407.12077

GoldFinch 是一种 RWKV/Transformer 混合序列模型,将新的 GOLD transformer 叠加在 Finch(RWKV-6)架构的增强版本之上,有效地在线性时间和空间中生成高度压缩和可重用的 KV-Cache。

相对于 1.5B 参数的 Finch 和 Llama 模型而言,GoldFinch 的建模性能显着提高。


RWKV 模型介绍

RWKV 是一种创新的深度学习网络架构,它将 Transformer 与 RNN 各自的优点相结合,同时实现高度并行化训练与高效推理。

RWKV 模型架构论文:

  • RWKV-5/6(Eagle & Finch): https://arxiv.org/abs/2404.05892
  • RWKV-4:https://arxiv.org/abs/2305.13048

     

加入 RWKV 社区

欢迎大家加入 RWKV 社区,可以从 RWKV 中文官网了解 RWKV 模型,也可以加入我们的 QQ 频道,一起探讨 RWKV 模型。

  • RWKV 中文官网:https://rwkv.cn/
  • QQ 频道:https://pd.qq.com/s/9n21eravc

相關推薦

2024-08-01

大家好,《RWKV 社区最新动态》迎来了第三期内容,本期统计了 RWKV 社区 7 月的重要动态,一起来看看吧! 省流版本: RWKV 官方公告 RWKV-6-World 14B 模型已发布 RWKV 中文官网 rwkv.cn 正式上线 RWKV 社区新项目 RWKV RAG:

2022-11-18

2022年11月16日,openKylin社区11月技术委员会会议采取线上+线下形式召开,由openKylin社区技术委员会委员余杰主持,吴庆波主任、魏立峰副主任等全体成员参加。会上,各与会人员围绕社区近期工作成果和后续工作开展计划进行了

2022-10-01

为推动社区繁荣发展,打造开源操作系统创新生态,openKylin社区在积极持续开展各种技术研究和创新。其中,9月份社区新增SIG小组9个,覆盖智能应用、基础硬件、云端融合、人机交互、互联协同等领域,目前共计有47个SIG组在

2024-06-28

6月25日,openKylin社区第四次国际交流活动成功举办,来自乌兹别克斯坦、柬埔寨、缅甸、尼日利亚等国家的4名北京大学留学博士生参加本次活动。这场活动旨在进一步推进openKylin社区与国际企业、爱好者建立稳定友好的交流伙

2023-11-10

双周同步开源进展 欢迎加入 KCL 社区进行互动~   KCL 是一个 CNCF 基金会托管的基于约束的记录及函数语言并通过成熟的编程语言技术和实践来改进对大量繁杂配置比如云原生 Kubernetes 配置场景的编写,致力于构建围

2024-07-26

介绍 SRA-ADMIN 是一个前后端分离的后台管理系统,引入了市面上常用的工具包以及核心框架,实现了用户、字典、角色、权限等常见功能, 能够快速搭建一个web项目。   后端技术栈:springboot3+sqltoy+satoken+hutool   前端技术

2023-07-11

这些问题,又经过项目团队半年多的打磨,现在推出面向社区用户来共同使用。 Koala Form 是什么 Koala Form 是一个表单页面的低代码解决方案,以 Vue3 为基础,围绕中后台产品的表单场景进行抽象,帮助开发者进行配置化

2023-05-16

降本增效”浪潮中被解雇。 Ben Cotton 从 2009 年加入 Fedora 社区,并于 2018 年 正式加入红帽,在过去五年一直担任 Fedora 项目经理,他是提出 CentOS Stream 计划的人之一。Fedora 项目经理主要负责协调 Fedora 社区和利益相关者,包括从

2024-07-06

任何问题,也欢迎提交 issues,以及提交 pull requests,开源社区需要大家一起参与才能有蓬勃的生命力。

2024-08-20

ocket都都属于近期版本才做的支持, 对它们的标准化支持社区也是在摸着石头过河,我们也需要用户不断的反馈和迭代完善,因此欢迎社区用户多给我们提优化意见和测试用例。 新增贡献者 @Itswag 非常感谢上面的贡献者积

2023-10-25

金会秘书长冯冠霖在致辞中表示,要推动服务器操作系统社区协同发展,打造门类齐全的开源项目堆栈。在已有项目孵化方面,基金会将不断提升开源项目运营服务能力,全力支持开源社区发展,推动开源生态繁荣,在保持社区

2024-06-29

书 PieCloudDB 在国产信创生态布局上再次迈出坚实一步,近期完成与华为鲲鹏 920 以及开源操作系统 openEuler 的兼容互认证,进一步证实 PieCloudDB 具备 ARM 系统支持能力,成为对 x86 和 ARM 架构均完整适配的数据库,再次证明了其

2023-08-11

到了“代码一次开发,三个平台部署”。 04 ArkUI-X 开源社区 ArkUI-X是由OpenHarmony TSC-跨平台应用开发框架TSG所孵化的开源项目,更多关于基于ArkUI-X的应用开发手册、框架开发手册、ArkUI-X版本包、ArkUI-X 样例代码、社区Roadmap等信

2023-09-15

图:优化仪表盘、词云图、文本卡、指标卡的使用 近期社区用户向DataEase项目组反馈了一些问题,例如仪表盘的刻度标签显示、词云图文字大小及文字间距相关视觉效果、文本卡和指标卡的名称及值的分别设置等,DataEase在v1.18