最强开源 AI 搜索框架 —— OpenDeepSearch 超越 GPT-4o


OpenDeepSearch 在 frames-benchmark 上超过了 GPT-4o 的 Search 功能,成为最强的开源 AI 搜索框架。

这个框架结合语义搜索,并提供了快速和深度搜索两种模式,允许多跳搜索(即不断检索以得到理想答案),并且专门为 AI Agent 优化。 

OpenDeepSearch 在开源仓库的 README 中写道:“用开源推理模型与智能代理技术实现搜索民主化”。

OpenDeepSearch 包含两个核心组件,分别用于提供高质量的网络搜索结果,以及基于语义重排和多源整合优化检索效果。

OpenDeepSearch 旨在与 AI Agent 无缝集成。它支持深度 Web 搜索和检索,并针对与 Hugging Face 的 SmolAgents 生态系统一起使用进行了优化。

比较有意思的是,OpenDeepSearch 的系统提示词有一句是:如果你成功解决了问题,你将得到一百万美元......


相關推薦

2024-07-11

通义千问(Qwen2-72B)既是排名最高的中国大模型,也是全球最强的开源大模型,性能超越文心一言4.0、讯飞星火V4.0、Llama-3-70B等开闭源大模型。 SuperCLUE报告认为通义千问“超过众多国内外闭源模型”,“引领全球的开源生态”。

2025-03-28

能,甚至逼近了 OpenAI 的顶级闭源模型。这一成果标志着开源模型在与商用 AI 产品竞争中的又一次重大突破。 TAO 方法的核心在于其独特的 “测试时计算” 理念,能够自动探索任务的多样性,同时结合强化学习来优化模型,

2024-08-10

阿里通义团队开源新一代数学模型Qwen2-Math,包含1.5B、7B、72B三个参数的基础模型和指令微调模型。 Qwen2-Math基于通义千问开源大语言模型Qwen2研发,旗舰模型 Qwen2-Math-72B-Instruct在权威测评集MATH上的得分超越GPT-4o、Claude-3.5-Sonnet、

2024-09-30

O。 “我们深切致力于我们的使命,并为我们发布的业内最强大、最安全的模型感到自豪,”她表示。 《华尔街日报》所有者新闻集团与 OpenAI 有内容授权合作关系。 以下内容基于对 OpenAI 现任和前任员工及公司内部人士的采

2025-04-09

Cherry Studio 是一款支持多个大语言模型(LLM)服务商的开源桌面客户端,兼容 Windows、Mac 和 Linux 系统。 Cherry Studio 昨天发布了最新的 1.1.19 版本,此次更新带来了全新的 QuickPanel 功能、对gpt-4o-mini及网页搜索引用的支持、多项 MCP

2024-07-26

在 Meta 推出开源 Llama 3.1 模型之后不久,OpenAI 宣布对其 GPT-4o Mini 模型提供免费微调,允许用户免费使用额外数据训练模型,以便在特定用例中获得更高的性能。 GPT-4o mini 微调适用于 OpenAI 的 Tier 4 和 5 使用层级的开发人员,这

2025-04-16

官方文档直言不讳地指出,这批新模型在各项能力上全面超越了此前的GPT-4o和GPT-4o mini,在编码能力、指令遵循、长文本处理等核心维度实现了进步,并辅以全新定价策略,其知识库也已刷新至2024年6月。 OpenAI的核心目标明确:

2024-08-08

= -29 / 8" } 最后再来看一下当前世面上的一些格式化输出框架:

2025-04-08

I新阶段的核心动力。 3月25日,美国谷歌公司发布了号称最强推理模型的双子座 2.5 Pro。据介绍,它是谷歌旗下最先进的复杂任务模型,展示了强大的推理和代码能力,并拥有双子座系列此前各模型所具有的全部功能。 同一天

2024-08-07

利润和商业利益置于公众利益之上,还违背了免费共享或开源公司技术的承诺,选择向微软提供技术的独家许可。 马斯克主张的核心在于,他认为自己被 Altman 和现任 OpenAI 总裁 Greg Brockman“引诱和欺骗”,以非营利组织为由共

2025-04-12

计划介绍 免费版本 每月 50 次使用慢速高级模型(GPT-4o、Claude 3.5 Sonnet、Claude 3.7 Sonnet等),使用完,只能换账号了。 使用限制:每月 2000 次代码生成。 Pro专业版 每月20美元(折合人民币145¥),年付:192/年(1393¥

2025-03-22

天凌晨,OpenAI 上线了全新语音模型 API,具体包括: gpt-4o-transcribe (语音转文本):单词错误率 (WER) 显著降低,在多个基准测试中优于现有 Whisper 模型 gpt-4o-mini-transcribe (语音转文本):gpt-4o-transcribe 的精简版本,速度更快、效

2024-08-01

对来自 OpenAI、Anthropic、Google 和 Meta 等品牌的 22 个(12 个开源 LLM 和 10 个专有 LLM)领先的生成式 AI 大语言模型性能进行了比较排名。 Hallucination Index 使用 Galileo 专有的评估指标“context adherence”对开源和闭源模型进行了测试。

2025-04-10

即将到来的 WWDC 2025 上,苹果会推出一个类似 MCP 的创新框架(根据苹果一贯的风格,很可能不会简单照搬现有标准),并在操作系统和系统应用中深度集成该能力? 结合苹果不局限于某个特定云端 AI 大模型的开放策略,一个