OpenAI 神秘新模型 o3-alpha 现身 Web Arena 平台


OpenAI 正在测试名为“o3-alpha-responses-2025-07-17”(公开代号为“anonymous-chatbot-0717”)的新模型,该模型于 2025 年 7 月 17 日在 WebDev Arena(一个前端开发测试竞技场)短暂测试后下架 。

测试显示,o3-alpha 在网页设计、前端代码生成(如使用 Three.js 创建程序化星球、生成 Doodle Jump 等网页游戏)以及复杂游戏(如 Minecraft 和 GTA 克隆版)开发方面表现突出,远胜于 OpenAI 的 o3、GPT-4.1-2025-04-14,以及 Claude Sonnet、Gemini 2.5 Pro 和 Grok 4 等竞品。

此外,有猜测称该模型可能与近期在东京 AtCoder 启发式编程世界杯总决赛中获得亚军的模型有关,但 OpenAI 未官方确认。

目前,该模型既非 OpenAI 计划开源的模型,也非传闻中的 o4(官方称 o4 不存在),可能是 o3 的重大升级版或 GPT-5 的前期技术验证,但无官方背书。


相關推薦

2025-07-23

来自字节跳动(ByteDance)的神秘新视频模型Waver 1.0已现身Video Arena排行榜,并在榜单上进入了第三名的位置。 值得关注的是,这款模型在文生视频和图生视频榜单上都是排名第三。文生视频仅次于字节之前发布的Seedance 1.0和

2025-03-21

腾讯开源发文宣布,腾讯混元首次上榜海外权威大模型竞技场 Chatbot Arena 最新排名,跻身全球 Top 15。 Chatbot Arena 发起方 LMSYS Org (加州大学伯克利分校等机构支持的非营利组织)通过官方X账号对腾讯混元的加入表示欢迎。 “

2025-06-06

生成等细分任务中,DeepSeek等开源模型已能在性能上直逼OpenAI等闭源模型,形成“性能差距逐步收敛”的新趋势。“中国与开源的崛起将AI竞争推向多极对抗的新时代,不再是巨头一家独大的游戏。” 核心观点:AI 变革速度颠覆

2023-02-05

下玩的 Windows 游戏。新支持的游戏包括《哥谭骑士》、《神秘海域:盗贼之遗》、《黑暗英雄》、《超级街机赛车》、《疯狂机器 3》、《山下之王》、《忍忍之日 2》和《麻将女郎》。 (Gotham Knights, UNCHARTED: Legacy of Thieves Collec

2025-03-28

,展现出了优于传统标注微调方法的性能,甚至逼近了 OpenAI 的顶级闭源模型。这一成果标志着开源模型在与商用 AI 产品竞争中的又一次重大突破。 TAO 方法的核心在于其独特的 “测试时计算” 理念,能够自动探索任务的多

2022-03-01

Go 语言社区正在讨论名为「arena」的新提案。 根据提案的介绍,「Go arena」用于优化内存分配。arena 是一种从连续的内存区域分配一组内存对象的方法,其优点是从 arena 分配对象通常比一般内存分配更有效。更重要的是,a

2025-05-23

腾讯混元宣布模型矩阵全面升级: 旗舰快思考模型混元TurboS、深度思考模型混元T1升级,并基于TurboS基座,腾讯新推出视觉深度推理模型T1-Vision和端到端语音通话模型混元Voice 腾讯混元图像2.0、腾讯混元3D v2.5及混元游戏视

2025-05-23

实时流式传输内联更改。至关重要的是,v0-1.0-md 使用与 OpenAI 兼容的 API,这意味着您可以将其插入现有工具(例如 Cursor、Codex)或自定义应用程序(只要这些应用程序已经支持 OpenAI 语言规范),包括 Vercel 自己的 AI SDK。 i

2025-04-25

人工智能的直接关联而备受关注。过去,它曾被 Google、OpenAI 和 Elon Musk 的 xAI 使用,最近的变动显示它可能已从 DeepSeek 解绑,并重定向到一个新网站。 根据 2025 年 4 月的 WHOIS 记录,ai.com 的注册机构为 Squarespace Domains II LLC,这

2025-04-02

Nova Act 是亚马逊试图利用自己的通用人工智能代理技术与OpenAI 的 Operator 和 Anthropic 的 Computer Use 竞争的尝试。几家领先的科技公司认为,能够为用户导航网络的人工智能代理将使当今的人工智能聊天机器人更加有用。 亚马逊可

2025-03-21

腾讯混元通过官方公众号宣布,全新的推理模型 T1 将于本周五(北京时间 3 月 21 日 23 时)正式发布。 与此同时,腾讯宣布,混元大模型首次登上 Chatbot Arena 榜单,跻身全球 Top 15。用户在该平台上以匿名方式与多个模型互动

2023-09-27

Flutter + Golang 开发,代码完全开源,支持以下功能: OpenAI 的 GPT-3.5 ,GPT-4 大语言模型 Anthropic 的 Claude instant ,Claude 2.0 大语言模型 国产模型:通义千问,文心一言,讯飞星火,商汤日日新,腾讯混元大语言模型 开源大

2024-08-02

式发布v1.4.0版本。在这一版本中,MaxKB的社区版支持对接OpenAI、Ollama和本地的向量模型,并且支持设置模型的使用权限,同时MaxKB还支持知识库自定义向量模型。 自v1.4.0版本开始,MaxKB正式推出专业版。MaxKB专业版在社区版基础

2025-05-09

抱 DeepSeek 速度很快,同时 DeepSeek 的开源加快了理想自研模型的步伐,DeepSeek 的出现给理想带来了巨大的收益和帮助。 李想在采访中还提到,VLA 的成功离不开中国 AI 的崛起。他表示,DeepSeek、通义千问等模型的出现让中国 AI