DeepSeek V3 模型更新,大幅提升编程能力


北京时间 3 月 24 日晚,DeepSeek 「突然」发布了模型更新。

但暂时还不是 DeepSeek V4 或 R2,而是 DeepSeek V3 模型的一次更新。

目前,其开源版本目前已经上架开源网站。其开源版本模型体积为 6850 亿参数。

https://huggingface.co/deepseek-ai/DeepSeek-V3-0324

深度求索微信官方公众号也确认,本次更新属于小版本升级,目前已经在官方网页、App 小程序等入口开放。

初代 V3 模型最为人所熟知的,可能还是「557.6万美金比肩Claude 3.5效果」的超级性价比。而更新后的模型由其新的 32KGPU 集群上改进的后训练提供支持。

截至目前,还没有任何关于新版 DeepSeek V3 的能力基准测试榜单出现,但有了 DeepSeek V3 发布即成为 Chatbot Arena 榜单前十中唯一一个开源模型的刷榜历史,还是在发布一小时后迅速吸引来全球用户对其测试体验。

根据目前最新的用户上手测试,新版 V3 模型前端编码能力的提升,是目前「感知最强」的部分。根据专业用户对新版 V3 的综合体验判断,V3-0324 的提升幅度大约相当于 Sonnet 3.5 到 Sonnet 3.6 的提升。

用户按照下面的提示词,同时对新版 V3 与 R1 下达任务,实际产出的效果已经出现巨大差异。

创建一个包含 CSS 和 JavaScript 的单个 HTML 文件,以生成一个动画天气卡片。卡片应通过不同的动画直观地表示以下天气条件:风:(例如,移动的云朵、摇曳的树木或风线)雨:(例如,落下的雨滴、形成的水坑)晴:(例如,闪耀的光线、明亮的背景)雪:(例如,落下的雪花、积雪)并排显示所有天气卡片。卡片应具有深色背景。在此单个文件中提供所有 HTML、CSS 和 JavaScript 代码。JavaScript 应包含一种在不同天气条件之间切换的方法(例如,一个函数或一组按钮),以演示每种天气的动画。

左侧是 DeepSeek 新版 V3 模型的生成结果,右侧为 R1 的生成结果。

除了编程能力,在其他用户的测试中,新版 V3 在多轮对话中体现出了更强的上下文理解能力。

从网友反馈的实测效果来看,V3-0324 有这些提升:

  • 编码能力已经接近 Claude3.7 了,比之前的老版本 v3 能力要强;
  • 提升幅度大约与 Sonnet 3.5 到 Sonnet 3.6 一样,甚至还要大一点;
  • 与 R1 相比,V3-0324 在生成前端代码方面有了明显改进;
  • 数学能力也有提升,能像推理模型一样能够解题。

当然,与往常一样,DeepSeek 也没有同时公开表示 R2 或者 V4 模型会在何时发布,但不少用户在体验过新版 V3 后,都觉得似乎 R2 的到来,也已经不远了。

还有一个让开源社区非常兴奋的改变。新版 V3 的开源许可与 R1 一样,也更新变成了 MIT 开源许可(MIT License),这意味着新版 V3 有着比初代 V3 更宽松的开源使用条件。


最后,奉上 DeepSeek V3 最新版的免费体验地址,由模力方舟提供:

https://ai.gitee.com/serverless-api/packages/1917?model=DeepSeek-V3&package=1917

模力方舟的 Serverless API 提供了视频生成、文本生成、视觉模型、图像生成与处理、文档处理/OCR、自动语音识别、语音合成、特征抽取、代码生成、风控识别十大类共 58 款各领域的顶尖开源模型的在线体验和 API 使用。通过购买模型资源包,即可通过极低的价格即可尽享众多主流模型。


相關推薦

2025-03-27

DeepSeek-V3 模型近日进行了更新,虽然大家都说更新后的 DeepSeek-V3-0324 强到没边——哪怕叫 DeepSeek V3.5 也不为过,但官方仍低调地称其是“小版本升级”。 下面是官方针对 DeepSeek-V3-0324 发布的更新说明。 DeepSeek V3 模型已完成

2025-03-26

上新!DeepSeek-V3重磅升级 昨夜,DeepSeek-V3迎来一波更新,升级至「DeepSeek-V3-0324」版本。 不仅将模型参数量由原版的671B提升至685B,编程、数学等推理思考能力大幅提升,性能表现可以与Claude 3.5/3.7 Sonnet相媲美。同时,模型的开

2025-04-03

队一直在等待国内有能力支持 AutoDev 的国产模型,直到 DeepSeek V3-0324出现。 AutoDev 开源已有两年时间,如今已经进化成集成度最好的 JetBrains IDE 上的第二代 AI 编程工具,支持主流的 Intellij IDEA、WebStrom、Clion 等 IDE,还有基于 Intel

2025-03-27

,方便管理三方应用接入、授权、日志 AI组件支持接入DeepSeek,支持DS推理 PC前端:角色管理支持配置角色人员、菜单资源支持配置移动端菜单、确认删除提示支持明确哪条数据等 devtools工具:创建模型时支持导入视图、

2025-03-27

低服务器资源占用,同时深度融合各种大模型如智谱AI 、DeepSeek 等,开放 linux 一键部署。 它可以提供标准的文本翻译API,一方面可以配合 translate.js 进行使用,另一方面如果你需要文本翻译,完全可以使用它,而不用再

2025-03-25

耗,但克里希纳认为,新兴的技术(例如中国初创公司 DeepSeek 展示的方案)能够极大降低AI能耗,使之降到当前能耗的1%以下: 「DeepSeek 已经向我们展示,即使是小型模型也能发挥巨大作用。当然,问题在于我们是否仍需要

2023-07-27

GLM 技术团队宣布开源最新的代码模型 CodeGeeX2-6B。CodeGeeX2 是多语言代码生成模型 CodeGeeX 的第二代模型,基于 ChatGLM2 架构注入代码实现。 我们希望每一位程序员,都能在自己机器上跑上一个自己的编程助手。为实现这一目标

2025-04-01

AI 基准测试指标上均已领先于 OpenAI、Anthropic、xAI 乃至 DeepSeek。

2023-12-01

布,其探索 AGI(通用人工智能)的新组织“深度求索(DeepSeek)”继 11 月初发布 Coder 代码模型之后,正式发布通用大语言模型:DeepSeek LLM 67B。模型已完全开源,同时服务已经全面开放内测。 目前 DeepSeek 已同时开源 7B 和 67B 的

2025-03-27

考和推理能力显著提升,AIGC已成为全网增速最快赛道,DeepSeek APP上线次月活跃用户规模突破1.8亿,豆包APP破亿,腾讯元宝、纳米AI搜索在DeepSeek大模型加持下,跻身TOP5。 QuestMobile数据显示,纳米AI搜索、腾讯元宝APP在接入DeepS

2025-04-01

”,通过整合百度自研的文心X1、文心4.5等模型,并接入DeepSeek-R1等第三方优质模型,实现了多模型间的智能协同。用户可以选择“自动模式”,一键调用最优模型组合,也可根据需求灵活选择单一模型完成特定任务,大幅提升

2024-08-09

他众多企业中也获得广泛认可。 文心快码是基于文心大模型,并结合百度二十年编程现场大数据打造。如今全新升级为AI架构师,在保证快速完成基础代码编程的同时,需要更懂业务架构、更懂测试、更懂“领域”知识,能解

2025-03-28

机器人运动控制算法等10个岗位,月薪最高达7万元。 “DeepSeek的爆发加速了AI在各行各业的应用渗透。由于AI人才市场需求加剧,企业纷纷提高了招聘薪资水平。”智联招聘执行副总裁李强说。 智联招聘数据显示,2月份,算法

2024-08-04

DeepSeek 宣布启用上下文硬盘缓存技术,把预计未来会重复使用的内容,缓存在分布式的硬盘阵列中。如果输入存在重复,则重复的部分只需要从缓存读取,无需计算。该技术不仅降低服务的延迟,还大幅削减最终的使用成本。