xAI 宣布推出 Grok-2 和 Grok-2 mini 的测试版,不过目前仅面向 X 上的 Premium 和 Premium+ 用户。
Grok-2 是 xAI 目前最先进的 AI 助手。相对而言,Grok-2 mini 则更侧重于在速度和答案质量之间的平衡。该公司表示,计划本月晚些时候通过其新的企业 API 平台向开发人员提供这两种模型。
“我们很高兴发布 Grok-2 的早期预览版,这是我们之前型号 Grok-1.5 的重大进步,具有聊天、编码和推理方面的先进功能。同时,我们推出了 Grok-2 mini,它是 Grok-2 的一款体型虽小但功能强大的兄弟产品。Grok-2 的早期版本已在 LMSYS 排行榜上以“sus-column-r”的名称进行了测试。在撰写本博文时,它的性能已经超过了 Claude 3.5 Sonnet 和 GPT-4-Turbo。”
公告称,与 Grok-1.5 模型相比,Grok-2 和 Grok-2 mini 在推理、阅读理解、数学、科学和编码方面均有显著改进。它们在研究生水平的科学知识(GPQA)、常识(MMLU、MMLU-Pro)和数学竞赛题(MATH)等方面的表现都可与其他前沿模型相媲美。
此外,Grok-2 还在基于视觉的任务中表现出色,在视觉数学推理 (MathVista) 和基于文档的问题解答 (DocVQA) 中均达到了一流水平。
xAI 方面表示,该公司计划在 X 上部署 Grok-2 和 Grok-2 mini 的 AI 驱动功能,包括改进的搜索功能、帖子分析和回复功能。并计划发布多模式理解的预览版,作为 Grok 在 X 和 API 上的体验的核心部分。