Windsurf 发布 Wave 9 模型家族


Windsurf (原 Codeium) 发布了 Wave 9 模型家族,包括 SWE-1、SWE-1-Lite 和 SWE-1-Mini。

SWE-1 是一个前沿模型,专门为软件工程任务设计,在内部评估和产品使用中,其性能接近甚至超越现有前沿模型。

SWE-1-Lite 是一个更强大的新模型,将取代原有的 Cascade Base,对所有用户免费。SWE-1-Mini 是用于 Windsurf 中 tab 补全的改进模型。SWE-1 目前对 Pro 用户限时免费。

据 Windsurf 介绍,SWE-1 是其中最大、能力最强的 AI 模型,旨在突破现有大模型在软件工程实际需求上的局限。

相比只关注代码生成和单元测试的传统模型,SWE-1 更强调对开发流程中多种状态和上下文的感知能力(flow awareness),它能够在人机协作、任务未完成等复杂场景下持续推进工作。

根据基准测试,SWE-1 在 “对话式 SWE 任务基准” 和 “端到端 SWE 任务基准” 这两项核心指标上,都已经接近目前行业最强的前沿模型。特别是独立的端到端任务中,它的表现几乎和 Claude 系列最新模型能力相当。

在对话式任务中(任务做到一半,用户和模型交替操作,模型需要接着用户的进度继续完成任务),它目前的能力相当于 Claude 3.5 Sonnet。

参考来源:

https://windsurf.com/blog/windsurf-wave-9-swe-1

https://mp.weixin.qq.com/s/OS6Tz1nfUxgi0n4Dcf3bvg


相關推薦

2025-04-16

I 重磅推出 GPT-4.1 系列模型。发布会直播上,OpenAI邀请了 Windsurf 创始人兼 CEO Varun Mohan 分享经验。 Varun 透露,其内部基准测试显示,GPT-4.1 性能比 GPT-4 提升了 60%。鉴于 GPT-4.1 的出色表现,Windsurf 决定为所有用户提供一周的 GPT-4

2025-06-05

AI 编程工具 Windsurf 开发商发布公告称,Anthropic 在几乎没有预先通知的情况下切断了 Windsurf 的 API 访问权限。 根据 Windsurf 的声明,Anthropic 在提前不到一周的通知时间内,切断了其几乎所有 Claude 3.x 模型的直接访问权限 (first-pa

2025-05-31

5 亿和 5000 万事件量级,满足多样化研发需求。 Yandex 发布了 Yambda(Yandex Music Billion-Interactions Dataset,即 Yandex Music 十亿级交互数据集),这是全球最大的推荐系统开放数据集,包含近 50 亿条来自其音乐流媒体平台 Yandex Music 的

2025-03-29

日前宣布正式开源基于Hunyuan 3D 2.0技术框架的5款三维生成模型,进一步丰富 3D AIGC 社区。 本次开源的Turbo加速系列、多视图推理模块及轻量级mini模型,均基于Hunyuan 3D 2.0模型,组成了包含6大模型的Hunyuan 3D 2.0 家族。 轻量级

2025-03-20

AI 助手成为代码仓库的一部分 目前,AI 编程助手(如 Windsurf、Cursor、Codeium)在代码补全、重构优化等方面已经展现出强大能力,但它们仍然存在一个局限:缺乏对整个项目的全局理解。 为项目引入 Gitee MCP Server 后,AI 助手不

2024-09-26

余个业务,用以提升效率和优化产品体验。 此次活动还发布了视频生成模型、音乐模型、同声传译模型。在谭待的展示下,视频生成模型生成的多主体多动作交互镜头,人物表情流露真实,动作流畅自然。对于同一个场景,模

2023-08-18

案、想故事。 上周清华大学新闻与传播学院沈阳团队发布《大语言模型综合性能评估报告》,报告显示,百度文心一言在三大维度 20 项指标中综合评分国内第一,超越 ChatGPT,其中中文语义理解排名第一,部分中文能力超越

2024-07-27

大模型日均 tokens 使用量超过5000亿。 火山引擎在今年5月发布豆包大模型,提供包含大语言模型、语音模型、视觉模型的豆包模型家族,以满足不同场景的关键需求。自今年5月15日豆包大模型发布的2个月内,平均每家企业客户

2025-05-15

乏跨会话记忆的问题。 OpenMemory MCP支持在Cursor、Claude、Windsurf等多种AI应用之间共享和持久化记忆,所有数据处理均在本地进行,确保用户隐私。用户可通过简单的Docker设置部署该系统。 官方介绍如下: OpenMemory MCP Server

2022-10-04

2022 年 9 月的 Steam 调查数据已经发布,据外媒 Phoronix 介绍,9 月的 Linux 的使用率略有回落。 8 月份的数据显示,Steam 在 Linux 上的使用率为 1.27% ,7 月份为1.23%,6 月份为1.18%。而 10 月初发布的 Steam 调查数据显示,Steam 的 Linux 玩

2022-08-17

LZ4 v1.9.4 已发布,这是一个维护版本,包含大约 350 个 commit,也是近两年来发布的首个点版本更新。发布公告写道,liblz4 API 的稳定部分没有变更,使得这个版本可以直接替换现有的功能。开发团队也推荐用户升级到新版本。

2024-09-30

AMD 宣布推出 AMD-135M —— Llama 家族的第一个小型语言模型。该模型具有推测解码功能,其训练代码、数据集和权重都是开源的,以便开发人员可以重现该模型并帮助训练其他 SLM 和 LLM。 “大语言模型通常使用自回归方法进行

2023-04-08

百度官方发布声明称,其公司就 App Store 和各种应用商店上存在大量盗版“文心一言”App 的问题,已向北京市海淀区人民法院对苹果公司及相关开发者团队发起诉讼。 百度官方声明: 目前文心一言没有任何官方APP!在我司

2022-01-19

移动和物联网设备提供支持。安全公司 CrowdStrike 在最新发布的一份报告中指出,针对通常部署在物联网 (IoT) 设备中的基于 Linux 的操作系统的恶意软件在 2021 年比 2020 年增加了 35%,前三大恶意软件家族在 2021 年占所有基于 Linux