微软开源基于图的 RAG 系统:GraphRAG


微软开源了基于图的 RAG 工具 GraphRAG,可以在私有或以前未见过的数据集上进行问题解答。

GraphRAG 通过创建知识图谱来增强模型的推理和生成性能,使用 LLM GPT-4 对 GraphRAG 和传统 RAG 进行评估, GraphRAG 在全面性和多样性方面优于传统 RAG。

与使用纯文本片段的简单语义搜索不同,GraphRAG 从原始文本中提取知识图谱、构建知识模块结构、生成摘要,帮助大模型更好地捕捉文本中的复杂联系和交互,来增强其生成、检索等能力。

GraphRAG 使用大型语言模型从任何文本文档集合中自动提取丰富的知识图谱。这种基于图的数据索引最令人兴奋的功能之一是,它能够在用户查询之前报告数据的语义结构。它以分层方式检测密集连接节点的 "社区",在从高级主题到低级主题的多个层次对图进行分割。

使用 LLM 对这些社区中的每一个进行总结,就能创建数据的分层总结,从而提供数据集的概览,而无需事先知道要问哪些问题。每个社区都是描述其实体及其关系的社区摘要的基础。

这种方法尤其适合回答全局性问题。


GitHub 仓库 | 文档


相關推薦

2024-08-14

512 维的向量,但是业界一些向量 embeddings 服务厂商例如微软 Azure 和 OpenAI 已经支持到 3072 维,云搜索产品也已经支持存取多至 16000 维的向量数据。数据条数越大,维度越高,对检索资源的需求也越高。   为了匹配不同

2024-07-27

些权衡:召回率、读写时延、成本等。   比如,基于图结构的算法,选择将数据作为图中的数据点,而相近的点之间连接为边;查询向量从入口点出发,不断缩短距离,最终收敛得到结果。该类算法需要将构建的图结构

2024-08-01

练中,有望在 8 月发布! RWKV 官方动态 RWKV-6-World 14B 开源发布 2024 年 7 月 19 日,RWKV 开源基金会宣布正式向全球开源 RWKV-6-World 14B 模型。 RWKV-6-World 14B 是迄今最强的稠密纯 RNN 大语言模型。在最新的性能测试中,该模型英文

2024-08-03

tributor License Agreement 贡献者许可协议),正式加入openKylin开源社区。 言图科技,专注于大语言模型、自然语言处理以及私域知识库产品的研发与应用的高新技术企业。历经多年在人工智能领域的深耕细作,言图科技凭借深度

2024-08-02

依赖于预训练模型和外部知识库的即时查询。它擅长回答基于知识的特定问题,但缺乏对用户上下文和历史的深层理解。 Mem0 则引入了多层次的记忆存储机制,不仅能够记住用户的特定偏好和历史对话,还可以存储并调用更复

2024-08-22

理 权限管理 聊天记录管理 快速开始 # 注意: 此开源版本处于早期阶段,许多功能尚未完善或测试未完成,文档尚待完善,请勿在生产环境使用 git clone https://github.com/Bytedesk/bytedesk.git # 配置文件: bytedesk/starter/src/main/resour

2024-07-06

理 权限管理 聊天记录管理 快速开始 # 注意: 此开源版本处于早期阶段,许多功能尚未完善或测试未完成,文档尚待完善,请勿在生产环境使用 git clone https://github.com/Bytedesk/bytedesk.git # 配置文件: bytedesk/starter/src/main/resour

2024-07-13

理 权限管理 聊天记录管理 快速开始 # 注意: 此开源版本处于早期阶段,许多功能尚未完善或测试未完成,文档尚待完善,请勿在生产环境使用 git clone https://github.com/Bytedesk/bytedesk.git # 配置文件: bytedesk/starter/src/main/resour

2024-08-07

理 权限管理 聊天记录管理 快速开始 # 注意: 此开源版本处于早期阶段,许多功能尚未完善或测试未完成,文档尚待完善,请勿在生产环境使用 git clone https://github.com/Bytedesk/bytedesk.git # 配置文件: bytedesk/starter/src/main/resour

2024-09-30

2024年9月19日,飞致云旗下开源项目MaxKB成功加入Gitee平台主导的GVP计划,入选2024年GVP——Gitee最有价值开源项目。MaxKB也是继MeterSphere、DataEase和1Panel之后,飞致云旗下第四个入选GVP的开源项目。 ▲图1 MaxKB入选2024年Gitee最有价

2024-07-09

助您高效处理文本信息。 🧠 Munchkin 更新 优化多处RAG解析细节:解析更细致,使用体验更流畅。 支持上传Zip格式的文件知识:方便批量文件上传,知识导入一步到位。 优化 K8S调度支持使用Service Account:调度更加智能、

2023-06-08

和距离感。 visionOS 将包含来自 Adobe(特别是 Lightroom)、微软(Teams 和 Office)、思科(WebEx)Zoom 和其他主要开发商的应用程序——包括在 Vision Pro 上本地运行的 Unity 应用程序。有用于查看解剖图渲染图的医疗软件和用于在真实

2024-09-21

截至2024年9月18日17:30,FIT2CLOUD飞致云旗下开源项目——基于大语言模型和RAG的知识库问答系统MaxKB GitHub Star数超过10,000个!

2024-11-01

清华开源的这个叫 LongCite 的项目挺不错的,现在的大语言模型读取和检索文档内容,基本都是依靠 RAG,才能成为我们常说的知识库功能。 https://github.com/THUDM/LongCite 但 LongCite 有点不太一样,它的定位是信息检索工具,虽然也