Windsurf (原 Codeium) 发布了 Wave 9 模型家族,包括 SWE-1、SWE-1-Lite 和 SWE-1-Mini。
SWE-1 是一个前沿模型,专门为软件工程任务设计,在内部评估和产品使用中,其性能接近甚至超越现有前沿模型。
SWE-1-Lite 是一个更强大的新模型,将取代原有的 Cascade Base,对所有用户免费。SWE-1-Mini 是用于 Windsurf 中 tab 补全的改进模型。SWE-1 目前对 Pro 用户限时免费。
据 Windsurf 介绍,SWE-1 是其中最大、能力最强的 AI 模型,旨在突破现有大模型在软件工程实际需求上的局限。
相比只关注代码生成和单元测试的传统模型,SWE-1 更强调对开发流程中多种状态和上下文的感知能力(flow awareness),它能够在人机协作、任务未完成等复杂场景下持续推进工作。
根据基准测试,SWE-1 在 “对话式 SWE 任务基准” 和 “端到端 SWE 任务基准” 这两项核心指标上,都已经接近目前行业最强的前沿模型。特别是独立的端到端任务中,它的表现几乎和 Claude 系列最新模型能力相当。
在对话式任务中(任务做到一半,用户和模型交替操作,模型需要接着用户的进度继续完成任务),它目前的能力相当于 Claude 3.5 Sonnet。
参考来源:
https://windsurf.com/blog/windsurf-wave-9-swe-1
https://mp.weixin.qq.com/s/OS6Tz1nfUxgi0n4Dcf3bvg