Claude 推出"提示缓存"功能，减少延迟和成本

2024-08-17 發表於开源资讯

Anthropic 宣布在其 Claude 系列生成式 AI 模型的 API 中引入提示缓存（Prompt caching）功能，这将允许开发人员在 API 调用之间保存常用的提示，减少提示成本和延迟。

提示缓存允许用户缓存常用上下文，以便在将来的 API 调用中使用。该公司称，通过为模型配备背景知识和过去的示例输出，长提示的成本可降低高达 90%，延迟可降低高达 85%。

提示缓存在多种用例中很有用，包括能够保留代码库的汇总版本以供编码助手使用、在提示中提供长格式文档以及提供带有所需输出的几个示例的详细指令集。

用户还可以使用它与书籍、论文、文档和播客记录等长篇内容进行对话。根据 Anthropic 的测试，与一本缓存了 100,000 个 token 的书籍聊天需要 2.4 秒，而没有缓存信息的情况下则需要 11.5 秒。这相当于延迟减少了 79%。

与基本输入令牌价格相比，缓存输入令牌的成本高出 25%，但实际使用缓存内容的成本低 10%。实际价格因具体型号而异。

该功能现已在 Claude 3.5 Sonnet 和 Claude 3 Haiku 上作为公开测试版提供，并且很快将支持 Claude 3 Opus。详情可查看文档和定价页面。

相關推薦

突破边界，掌控 AI：VTJ.PRO v0.12.65 发布用户自主配置大模型时代正式开启

2025-07-24

用户自主配置AI大模型权限，支持开发者灵活接入 Gemini、Claude、GPT 等主流模型，实现“多模型协同+个性化决策”的开发范式革新。此次升级标志着低代码开发从“平台定义AI”迈入“开发者定义AI”的新阶段 🔧 一、核心升级

Cursor 0.50 发布，简化定价与增强 AI 编程体验

2025-05-13

外，Max模式现按每百万Token计费，支持所有顶级AI模型(如Claude3.7Sonnet、GPT-4o)，为处理大上下文或复杂任务提供了更高灵活性。功能亮点:多维度提升编程效率新Tab模型:跨文件智能重构 Cursor0.50引入了全新Tab模型，支持跨文

最佳开源模型：Qwen2- 72B -Instruct

2024-08-01

0k token）的性能。综合表现最佳模型： Anthropic 的 Claude 3.5 Sonnet。该闭源模型在短、中、长上下文场景中的表现均优于竞争模型。Anthropic 的 Claude 3.5 Sonnet 和 Claude 3 Opus 在各个类别中的得分始终接近满分，击败了去年的冠

InfoWorld 公布 2023 年最佳开源软件

2023-10-26

个软件包中，也让 Bun 成为 Node 和 Deno 的有力替代品。 Claude 2 Anthropic 的 Claude 2 在单个提示中最多可接受 100K tokens（约 7 万字），并可生成多达数千个 tokens 的故事。Claude 可以编辑、改写、总结、分类、提取结构化数据、根据

Anthropic 推出 Usage and Cost API

2025-08-21

分，旨在帮助开发者和组织以编程方式实时监控和追踪 Claude 模型的使用情况和成本。 https://docs.anthropic.com/en/api/admin-api/usage-cost/get-messages-usage-report 该 API 允许用户通过请求获取详细的用量报告。报告支持多种精细化的筛选和

OpenSearch 3.0 发布

2025-05-09

推进提供了动力，OpenSearch 开发者社区抓住了这个机会，推出了一系列技术创新，将 OpenSearch 提升到新的能力、性能和多样性层面。感谢他们的努力，以及技术指导委员会的监督，OpenSearch 3.x 系列现已准备好，帮助你应对未来应

AI 编程软件 Cline 回应 Anthropic 限制 Max 用量的新政策

2025-07-31

日前，Anthropic 开始针对 Claude Code 订阅用户加入新的每周用量限制，并且根据目前使用情况来计算，这一调整将影响不到 5% 的用户。具体来看，从 8 月 28 日起，Anthropic 将在现有的每 5 小时重置的用量限制基础上，增加每周用

Anthropic 推出 Claude Android 应用

2024-07-18

Anthropic 推出了 Claude Android 应用，旨在将其 AI 聊天机器人带给更多用户。Anthropic 的这一最新举措旨加强与 ChatGPT 之间的竞争力，让 Claude 在更多地方可用。 Claude Android 应用程序的工作方式与5 月份发布的 iOS 版本相同，包括免

Claude 新增聊天记录记忆功能

2025-08-13

Anthropic 为其 Claude 聊天机器人推出备受期待的“记忆”功能，用户可让机器人检索并参考过往对话内容。该功能支持网页、桌面及移动端，能区分不同项目和工作区。用户只需在 “个人资料” 的 “设置” 中开启 “搜索和查

减少 95% 资源的向量搜索 | 使用云搜索的 DiskANN

2024-07-27

场景下也极大提高了系统的稳定性。这是因为 DiskANN 极大减少了对内存资源的依赖，因此也具备了非常高的可扩展性，在我们的实践经验中也得到验证，从千万数据规模到十亿再到百亿，查询性能的波动非常小，具备非常高的系

Anthropic 为 Claude 增加联网搜索功能

2025-03-22

Anthropic 宣布为旗下 Claude 聊天机器人增加 Web 搜索功能，启用该功能后，Claude 会自动联网搜索信息，并在反馈结果中会提供引用出处，以便用户核实来源。据悉，搜索功能目前已面向美国 Cladue 付费用户推出预览版，不久将

Claude 更新：高级 Research 功能、深度集成 Google Workspace、语音模式即将上线

2025-04-18

Claude 母公司 Anthropic 宣布对其 AI 助手 Claude 进行重要升级，旨在进一步增强其作为高效协作工具的实用性。本次更新引入了两项新功能，Research 和 Google Workspace 深度集成。 Claude 本次新增的 Research 功能，与此前 OpenAI 在 ChatGPT

推特年度工程总结，数据感人，什么代码减少 60 万行、节省 1 亿美元

2023-10-31

：彻底重构 For you 服务和排名系统，代码行数从 700K 减少到 70K，减少了 90%，计算占用量减少了 50%，帖子吞吐量增加了 80%。重构了技术栈的 API 中间件层，并简化了架构，删除超过 10 万行代码和数千个未使用的内部端，

JetBrains 宣布推出 AI 工具免费套餐

2025-04-19

程开发支持。 AI Assistant 现在拥有更多模型选择，包括 Claude 3.7 Sonnet、Google Gemini 2.5 Pro 以及 OpenAI 的最新模型，以及具备更强大的本地模型集成功能。其他更新包括改进的代码补全、更强的上下文感知、可以编辑多个文件的新编

熱門推薦