一张图解释上下文工程(Context Engineering )


制图: Victoria Slocum

以下为解释

---------------------------
提示工程(Prompt Engineering)已死,上下文工程(𝗖𝗼𝗻𝘁𝗲𝘅𝘁 𝗘𝗻𝗴𝗶𝗻𝗲𝗲𝗿𝗶𝗻𝗴) 万岁!

(好吧,也没完全死掉——但它无疑正在进化成一种远为更强大的形态)

让我们来认识一下上下文工程(𝗖𝗼𝗻𝘁𝗲𝘅𝘁 𝗘𝗻𝗴𝗶𝗻𝗲𝗲𝗿𝗶𝗻𝗴)——这是一门艺术,致力于构建动态系统,从而精准地为大语言模型(LLM)提供成功完成任务所需的一切。

随着我们从简单的聊天机器人转向复杂的AI代理(Agent),我们正逐渐意识到,仅仅靠巧妙的提示语是不够的。真正重要的是精心编排一个完整的信息生态系统,并将这些信息输入到你的大语言模型中。

那么,这具体意味着什么呢?

它的核心在于构建动态系统,以正确的格式提供正确的信息和工具,从而让大语言模型能够切实地完成任务。

一个经过上下文工程设计的系统的构成解析:

✨用户信息 (𝗨𝘀𝗲𝗿 𝗜𝗻𝗳𝗼𝗿𝗺𝗮𝘁𝗶𝗼𝗻): 偏好、历史记录和个性化数据。
✨工具使用 (𝗧𝗼𝗼𝗹 𝗨𝘀𝗲): API、计算器、搜索引擎——任何大语言模型完成工作所需的工具。
✨RAG上下文 (𝗥𝗔𝗚 𝗖𝗼𝗻𝘁𝗲𝘅𝘁): 从像Weaviate这样的向量数据库中检索出的信息。
✨用户输入 (𝗨𝘀𝗲𝗿 𝗜𝗻𝗽𝘂𝘁): 当前实际的查询或任务。
✨代理推理 (𝗔𝗴𝗲𝗻𝘁 𝗥𝗲𝗮𝘀𝗼𝗻𝗶𝗻𝗴): 大语言模型的思考过程和决策链。
✨聊天历史 (𝗖𝗵𝗮𝘁 𝗛𝗶𝘀𝘁𝗼𝗿𝘆): 提供对话连续性的先前交互记录。

那么,它的记忆架构是怎样的呢?

✨短期记忆 (𝗦𝗵𝗼𝗿𝘁-𝘁𝗲𝗿𝗺 𝗺𝗲𝗺𝗼𝗿𝘆): 存在于上下文窗口中,处理当前对话。
✨长期记忆 (𝗟𝗼𝗻𝗴-𝘁𝗲𝗿𝗺 𝗺𝗲𝗺𝗼𝗿𝘆): 存储在向量数据库(如Weaviate)中,跨会话持久化存储用户偏好和过去的交互记录。

这为什么重要?
因为当代理系统(agentic systems)失败时,很少是因为模型本身不够聪明,而是因为我们没有给它提供正确的上下文。

信息的格式同样重要。一条结构清晰的错误信息,永远胜过一大堆杂乱的JSON数据。就像人类一样,大语言模型也需要清晰、易于理解的沟通方式。​​​​​​

转载自:蚁工厂 微博


相關推薦

2025-06-28

。Agent TARS 的设计原则包括: 上下文工程 (Context Engineering):为构建长时间运行的 Agent,新版本对 Agent Loop 的内存进行了动态优化,针对不同模态内容采用不同的滑动窗口,并面向上下文窗口进行优化和计算,以解决上下

2025-04-12

了一份长达 68 页的白皮书,系统阐述了提示工程(Prompt Engineering)的核心理念与最佳实践。 本白皮书详细讨论了提示词工程,探讨各种提示词技巧,帮助新手入门,并分享一些技巧和最佳实践,助任何人成为提示专家。还讨

2025-04-29

MaxKB同时支持目前最为流行的MCP(Model Context Protocol,模型上下文协议),为用户灵活调用MCP工具提供了充分的便利性。 在帮助企业落地DeepSeek的过程中,MaxKB开源项目组发现很多企业都有“智能问数”的需求,即允许员工使用自

2022-10-21

活动价69.7”。到这还没结束,最后弹窗提醒用户获得了一张“20元优惠券”,可用于超低价购买正版 Vscode。 不过最骚的操作当属这个——在安装界面中,「官方正版授权」文案下方写的是谷歌官网:https://www.google.com。 虽

2022-12-22

己的作品,然后选择将其退出训练集。 小编随手上传了一张图片进行搜索,在该站点找到了一大堆动漫/女孩相关的图像。但是如果我想要选择一些照片退出训练集,则需要注册一个账号。(顺便一提这个网站的账号密码需要大

2025-06-17

程,让我们在系统架构、工具设计和提示词工程(prompt engineering)等方面积累了重要经验。多智能体系统由多个智能体(即LLMs在循环中自主调用工具)协作完成任务。我们的Research 功能包含一个智能体,根据用户查询规划调研

2025-04-03

会出错。 来源:https://newsletter.manager.dev/p/the-13-software-engineering-laws

2021-11-16

要热度。 论坛里也有许多朋友在模仿 ATW 的“开局一张图,内容全靠编”,比如这位兄弟,宣称自己已经打包了整个中国两亿家企业所有资料,有意者速联系。这个帖子跟 ATW 的帖子标题格式一模一样,很难说不是在阴阳怪

2025-04-23

更流畅、更定制 升级中,Trae新版本不仅带来了智能体与上下文理解能力,还提供多种 AI 工具,并支持MCP自由接入各类外部资源;在产品交互形态上,Trae新版本把原先的Builder与Chat板块融合,打破了传统以代码为中心的IDE模式

2025-08-02

作为我们之前文章《长上下文如何失败》的后续,这篇将介绍我们可以如何缓解甚至完全避免这些失败。 但在开始之前,让我们快速回顾一下 ★ 长上下文常见的失败方式: 1. 上下文污染(Context Poisoning): 当幻觉或其他错

2025-06-12

FSE 2025(The ACM International Conference on the Foundations of Software Engineering)预计将在 2025 年 6 月于挪威特隆赫姆举行,字节跳动 ByteBrain 团队的论文《TickIt: Leveraging Large Language Models for Automated Ticket Escalation》成功入选 (https://arxiv.org/a

2023-08-08

岛! Bytebase 也是唯一一个同时被 CNCF Landscape 和 Platform Engineering Landscape 收录的数据库工具。 我们的初心不变:打造一个一站式平台,负责各种不同数据库的变更、查询、安全和治理。将类似 GitLab / GitHub 的代码管理和开发

2023-07-18

置本次请求的服务发现组件。 ghttp 改进请求Context上下文处理,每次Context的变更将会影响底层的http.Request对象。以支持自定义HTTP Handler的数据交互场景。 新增Endpoints配置项支持,用于自定义Server的服务注册发现地址,而

2025-05-01

求头或环境变量中提取认证令牌(Authorization),并通过上下文(context.Context)传递。 工具调用:注册一个名为 make_authenticated_request 的工具,用于向外部 API(httpbin.org)发送带认证的请求。 多传输协议支持:支持 SSE 和 stdio