微软开源基于图的 RAG 系统:GraphRAG


微软开源了基于图的 RAG 工具 GraphRAG,可以在私有或以前未见过的数据集上进行问题解答。

GraphRAG 通过创建知识图谱来增强模型的推理和生成性能,使用 LLM GPT-4 对 GraphRAG 和传统 RAG 进行评估, GraphRAG 在全面性和多样性方面优于传统 RAG。

与使用纯文本片段的简单语义搜索不同,GraphRAG 从原始文本中提取知识图谱、构建知识模块结构、生成摘要,帮助大模型更好地捕捉文本中的复杂联系和交互,来增强其生成、检索等能力。

GraphRAG 使用大型语言模型从任何文本文档集合中自动提取丰富的知识图谱。这种基于图的数据索引最令人兴奋的功能之一是,它能够在用户查询之前报告数据的语义结构。它以分层方式检测密集连接节点的 "社区",在从高级主题到低级主题的多个层次对图进行分割。

使用 LLM 对这些社区中的每一个进行总结,就能创建数据的分层总结,从而提供数据集的概览,而无需事先知道要问哪些问题。每个社区都是描述其实体及其关系的社区摘要的基础。

这种方法尤其适合回答全局性问题。


GitHub 仓库 | 文档


相關推薦

2024-08-14

512 维的向量,但是业界一些向量 embeddings 服务厂商例如微软 Azure 和 OpenAI 已经支持到 3072 维,云搜索产品也已经支持存取多至 16000 维的向量数据。数据条数越大,维度越高,对检索资源的需求也越高。   为了匹配不同

2024-07-27

些权衡:召回率、读写时延、成本等。   比如,基于图结构的算法,选择将数据作为图中的数据点,而相近的点之间连接为边;查询向量从入口点出发,不断缩短距离,最终收敛得到结果。该类算法需要将构建的图结构

2024-08-01

练中,有望在 8 月发布! RWKV 官方动态 RWKV-6-World 14B 开源发布 2024 年 7 月 19 日,RWKV 开源基金会宣布正式向全球开源 RWKV-6-World 14B 模型。 RWKV-6-World 14B 是迄今最强的稠密纯 RNN 大语言模型。在最新的性能测试中,该模型英文

2024-08-03

tributor License Agreement 贡献者许可协议),正式加入openKylin开源社区。 言图科技,专注于大语言模型、自然语言处理以及私域知识库产品的研发与应用的高新技术企业。历经多年在人工智能领域的深耕细作,言图科技凭借深度

2024-08-02

依赖于预训练模型和外部知识库的即时查询。它擅长回答基于知识的特定问题,但缺乏对用户上下文和历史的深层理解。 Mem0 则引入了多层次的记忆存储机制,不仅能够记住用户的特定偏好和历史对话,还可以存储并调用更复

2024-08-22

理 权限管理 聊天记录管理 快速开始 # 注意: 此开源版本处于早期阶段,许多功能尚未完善或测试未完成,文档尚待完善,请勿在生产环境使用 git clone https://github.com/Bytedesk/bytedesk.git # 配置文件: bytedesk/starter/src/main/resour

2024-07-06

理 权限管理 聊天记录管理 快速开始 # 注意: 此开源版本处于早期阶段,许多功能尚未完善或测试未完成,文档尚待完善,请勿在生产环境使用 git clone https://github.com/Bytedesk/bytedesk.git # 配置文件: bytedesk/starter/src/main/resour

2024-07-13

理 权限管理 聊天记录管理 快速开始 # 注意: 此开源版本处于早期阶段,许多功能尚未完善或测试未完成,文档尚待完善,请勿在生产环境使用 git clone https://github.com/Bytedesk/bytedesk.git # 配置文件: bytedesk/starter/src/main/resour

2024-08-07

理 权限管理 聊天记录管理 快速开始 # 注意: 此开源版本处于早期阶段,许多功能尚未完善或测试未完成,文档尚待完善,请勿在生产环境使用 git clone https://github.com/Bytedesk/bytedesk.git # 配置文件: bytedesk/starter/src/main/resour

2024-07-09

助您高效处理文本信息。 🧠 Munchkin 更新 优化多处RAG解析细节:解析更细致,使用体验更流畅。 支持上传Zip格式的文件知识:方便批量文件上传,知识导入一步到位。 优化 K8S调度支持使用Service Account:调度更加智能、

2023-06-08

和距离感。 visionOS 将包含来自 Adobe(特别是 Lightroom)、微软(Teams 和 Office)、思科(WebEx)Zoom 和其他主要开发商的应用程序——包括在 Vision Pro 上本地运行的 Unity 应用程序。有用于查看解剖图渲染图的医疗软件和用于在真实

2024-08-27

,国内已有180家公司正式推出了自己的AI大模型服务。在开源社区中,用户可部署使用的大模型更是多如繁星,数不胜数。 这些模型按照功能可以分为通用语言处理、语音处理、图像处理以及向量化处理等多个类别,琳琅满目

2024-06-13

的关键组件组成。Munchkin为我提供了AI模型管理、知识库RAG、通道管理、机器人管理等超级强大的能力。而且,我现在的底层架构也调整为了更加强大的K8S架构。 其次,我的知识库也进行了升级,现在支持附件知识、文件知识、

2023-01-20

GCompris 是一款针对 2~10 岁儿童的开源教育套件,着重训练孩子的听力、记忆力、色彩识别、数学思维、逻辑推理等全面能力的发展。GCompris 始于 2000 年,这个教育套件包括 100 多个活动。 目前 GCompris 3.0 发布了,GCompris