开源中国发布大模型技术图谱(LLM Tech Map)


LLM 技术图谱 (LLM Tech Map) 是将 LLM 相关技术进行系统化和图形化的呈现,此图谱主要特点是“专注于技术人视角”,不求从 LLM 产业角度汇聚信息,而是希望让从事相关工作或是想了解 LLM 的技术人有一个快速感知。

核心价值:帮助技术人快速了解 LLM 的核心技术和关键方向。

LLM 技术图谱(LLM Tech Map)从基础设施大模型AgentAI 编程工具和平台,以及算力几个方面,为开发者整理了当前 LLM 中最为热门和硬核的技术领域以及相关的软件产品和开源项目。


基础设施

LLM 技术图谱(LLM Tech Map)的基础设施部分主要包括以下几个方面:

  • 向量数据库:向量数据库是专门用于存储和检索向量数据的数据库,它可以为 LLM 提供高效的存储和检索能力。
  • 数据库向量支持:传统数据库通常不支持向量数据的存储和检索,数据库向量支持可以为传统数据库添加向量数据的存储和检索能力。
  • 大模型框架、微调 (Fine Tuning):针对大模型的开发。
  • 大模型训练平台与工具

大模型

LLM 技术图谱(LLM Tech Map)的大模型部分主要包括以下几个方面:

  • 备案上线的中国大模型:有牌照提供服务的大模型,需要注意的是大模型和相应的产品多半名称不同。
  • 知名大模型:在全球范围内,已经发布了多款知名大模型,这些大模型在各个领域都取得了突破性的进展。
  • 知名大模型应用:LLM 已经在多种应用场景中得到了应用,包括文本生成、机器翻译、问答、自然语言推理等。

AI Agent(LLM Agent)

LLM Agent 是指基于 LLM 技术构建的智能代理,它可以用于各种任务,比如让机器与 ChatGPT 交互,一层一层挖掘信息,自动化完成任务;比如由机器人构成的虚拟小镇。

AI 编程

让 LLM 帮你编写代码。

工具和平台

LLM 技术图谱(LLM Tech Map)的工具和平台部分主要包括以下几个方面:

  • LLMOps:简单点说(大家当前在说的),就是“快速从大模型到应用”。
  • 大模型聚合平台:汇聚大模型能力,提供服务。
  • 开发工具:其它开发相关的 LLM 工具。

算力

LLM 模型的训练和部署需要大量的算力,算力是 LLM 技术发展的关键因素。


LLM Tech Map 已托管到 Gitee:https://gitee.com/oschina/llm-map


相關推薦

2023-10-08

PT-4,以快速启动 AI 项目。 Ollama 管理:Ollama 简化了开源 LLM 的本地管理,让你的 AI 开发过程更加顺畅。 Neo4j 作为默认数据库:Neo4j 作为默认数据库,提供图形和原生向量搜索功能。这有助于揭示数据模式和关系,最终提

2024-07-05

微软开源了基于图的 RAG 工具 GraphRAG,可以在私有或以前未见过的数据集上进行问题解答。 GraphRAG 通过创建知识图谱来增强模型的推理和生成性能,使用 LLM GPT-4 对 GraphRAG 和传统 RAG 进行评估, GraphRAG 在全面性和多样性方

2023-11-10

爆料者 Tech_Reve 发表推文表示,苹果公司正在使用大语言模型 (LLM) 将 Siri 彻底改造成“终极虚拟助理”,并准备将其开发为“最强大的杀手级 AI 应用”。 目前苹果正在积极推进这项开发工作,首款产品预计将在 WWDC 2024 上亮相

2024-01-16

b  ——  一个旨在解决大模型相关资产治理难题的开源项目。 CSGHub的使命是为用户提供一个开源开放的、针对大模型原生设计的资产管理平台,支持私有化部署和离线运行。我们的目标是为用户创造一个安全、高效且可

2024-08-10

rprise 版主要提供一个长周期支持的、稳定的 Doris 内核。 开源的 Apache Doris 内核迭代比较快,新功能不断合入,企业客户在不断体验新功能的同时,也会担忧投入生产后的稳定性问题。所以,SelectDB 基于开源 Doris 提供了一个企业

2023-08-06

意识形态、非法涉黄等多项维度,二是常识问答,涵盖有中国文化、历史、地理和生活等常识知识。新华网物联网技术总监葛振斌表示,“大模型生成的内容必须符合当地法律和社会道德要求。可以说,各个国家都需要‘更适合

2023-10-20

【源创会预告】1024 程序员节(的前两天),相约开源PHP办公室,我们一起聊 AI!>>> 百度首席技术官王海峰在解读文心大模型 4.0 背后的关键技术和最新进展时表示,文心大模型 4.0 的理解、生成、逻辑、记忆四大能力都有显著

2024-08-17

技术进展方面,该季度内阿里云发布了全球性能最强的开源模型Qwen2-72B,该模型提升了代码、数学、推理、指令遵循、多语言理解等能力。Qwen2-72B发布后即登顶HuggingFace 的Open LLM Leaderboard开源模型榜单。中文大模型测评基准Super

2023-07-08

【中国,东莞,2023年7月7日】华为开发者大会2023(Cloud)7月7日在中国东莞正式揭开帷幕,并同时在全球10余个国家、中国30多个城市设有分会场,邀请全球开发者共聚一堂,就AI浪潮之下的产业新机会和技术新实践开展交流分享

2023-03-09

arDB for PostgreSQL(简称PolarDB-PG )凭借在数据库开源领域的深耕布局和产品技术实力,荣获“开源数据库杰出贡献奖”。 PolarDB for PostgreSQL是阿里云自主研发的云原生数据库产品,100%兼容 PostgreSQL,采用基

2023-04-06

测,生成 Response。 论文发布后不久,微软就在 GitHub 开源了基于论文实现的项目——JARVIS,项目地址:https://github.com/microsoft/JARVIS。其自我描述是用于连接 LLM 和 AI 模型的协作系统。该系统由 LLM(大语言模型)作为控制器和

2023-05-16

Dify.AI 宣布正式开源,并临时决定将开源协议从 AGPL 放宽到 Apache 2.0。Dify.AI 与飞蛾 (FEIE.WORK) 创始人表示: 开源!从第一天起我们就志在要代表中国团队做一个像 Docker、Stripe 那样的世界级产品,一个大模型能力上的 OS。虽然

2024-08-28

在2024中国国际大数据产业博览会配套活动上,国内首份“数据产业图谱(2024)”对外发布。 最新调研结果显示,我国现有数据领域相关企业超19万家;“数据产业图谱(2024)”展示了全国约2200家典型数据企业,其中,数据应

2023-07-22

tGLM(内测版)发布。 相关阅读: 清华系公司智谱 AI 开源 ChatGLM-6B 大模型,千亿基座对话模型开启内测 360 合作智谱 AI,共研千亿级大语言模型 360GLM 智谱 AI 官宣:ChatGLM2-6B 可免费商用