DeepSeek 官方详解 V3 模型“小版本”升级,各项能力全面进阶


DeepSeek-V3 模型近日进行了更新,虽然大家都说更新后的 DeepSeek-V3-0324 强到没边——哪怕叫 DeepSeek V3.5 也不为过,但官方仍低调地称其是“小版本升级”。

下面是官方针对 DeepSeek-V3-0324 发布的更新说明


DeepSeek V3 模型已完成小版本升级,目前版本号 DeepSeek-V3-0324,用户登录官方网页、APP、小程序进入对话界面后,关闭深度思考即可体验。API 接口和使用方式保持不变。

如非复杂推理任务,建议使用新版本 V3 模型,即刻享受速度更加流畅、效果全面提升的对话体验。

模型能力提升一览

推理任务表现提高

新版 V3 模型借鉴 DeepSeek-R1 模型训练过程中所使用的强化学习技术,大幅提高了在推理类任务上的表现水平,在数学、代码类相关评测集上取得了超过 GPT-4.5 的得分成绩。

新版 V3 模型的百科知识(MMLU-Pro, GPQA)、数学(MATH-500, AIME 2024)和代码任务(LiveCodeBench)表现均有提升

前端开发能力增强

在 HTML 等代码前端任务上,新版 V3 模型生成的代码可用性更高,视觉效果也更加美观、富有设计感。

动图展示了一个由模型生成的演示多个小球在指定空间范围内运动的 p5.js 程序,包含若干可以调整重力、摩擦力等参数的滑动按钮,并以赛博朋克风格的 HTML 呈现

中文写作升级

在中文写作任务方面,新版 V3 模型基于 R1 的写作水平进行了进一步优化,同时特别提升了中长篇文本创作的内容质量。

中文搜索能力优化

新版 V3 模型可以在联网搜索场景下,对于报告生成类指令输出内容更为详实准确、排版更加清晰美观的结果。

此外,新版 V3 模型在工具调用、角色扮演、问答闲聊等方面也得到了一定幅度的能力提升。

模型开源

DeepSeek-V3-0324 与之前的 DeepSeek-V3 使用同样的 base 模型,仅改进了后训练方法。私有化部署时只需要更新 checkpoint 和 tokenizer_config.json(tool calls 相关变动)。模型参数约 660B,开源版本上下文长度为 128K(网页端、App 和 API 提供 64K 上下文)。

V3-0324 模型权重下载请参考:

  • Model Scope: https://modelscope.cn/models/deepseek-ai/DeepSeek-V3-0324
  • Huggingface: https://huggingface.co/deepseek-ai/DeepSeek-V3-0324

与 DeepSeek-R1 保持一致,此次我们的开源仓库(包括模型权重)统一采用 MIT License,并允许用户利用模型输出、通过模型蒸馏等方式训练其他模型。


最后,奉上 DeepSeek V3 最新版的免费体验地址,由模力方舟提供:

https://ai.gitee.com/serverless-api/packages/1917?model=DeepSeek-V3&package=1917

模力方舟的 Serverless API 提供了视频生成、文本生成、视觉模型、图像生成与处理、文档处理 / OCR、自动语音识别、语音合成、特征抽取、代码生成、风控识别十大类共 58 款各领域的顶尖开源模型的在线体验和 API 使用。通过购买模型资源包,即可通过极低的价格即可尽享众多主流模型。


相關推薦

2025-03-27

北京时间 3 月 24 日晚,DeepSeek 「突然」发布了模型更新。 但暂时还不是 DeepSeek V4 或 R2,而是 DeepSeek V3 模型的一次更新。 目前,其开源版本目前已经上架开源网站。其开源版本模型体积为 6850 亿参数。 https://huggingface.co/dee

2025-03-27

,方便管理三方应用接入、授权、日志 AI组件支持接入DeepSeek,支持DS推理 PC前端:角色管理支持配置角色人员、菜单资源支持配置移动端菜单、确认删除提示支持明确哪条数据等 devtools工具:创建模型时支持导入视图、

2025-04-19

思考能力尤为引人注目。该模型在性能上可与行业领先的DeepSeek-V3-0324(短思维链)及DeepSeek-R1(长思维链)相媲美,标志着理想汽车在AI技术上的深厚积累。用户现在可以通过理想同学手机App及网页版免费体验这一全新模型,感受

2025-03-22

快手搜索官方宣布已全面接入DeepSeek R1的大模型能力,优化搜索效果与用户体验,未来也会持续探索智能搜索场景的商业化变现能力。 此前,快手已宣布可灵AI已全面接入DeepSeek-R1,在视频生成、图片生成等场景下,用户可通过D

2025-04-18

库对接 支持 AI 模型 AI 大模型 支持 DeepSeek √ ChatGTP √ Qwq √ 智库 √ Ollama 本地搭建大模型 √ 等等。。 √ AIGC 应用平台介绍 JeecgBoot 平台的 AIGC 功能模块,是一套类

2025-03-27

低服务器资源占用,同时深度融合各种大模型如智谱AI 、DeepSeek 等,开放 linux 一键部署。 它可以提供标准的文本翻译API,一方面可以配合 translate.js 进行使用,另一方面如果你需要文本翻译,完全可以使用它,而不用再

2025-04-10

地安全运行的同时,显著提升了 AI 助手环境感知能力与 deepseek 指令理解能力,极大地影响了任务执行效率和准确度。 一、强化本地运行安全保障 在数据安全备受重视的当下,Wisdom SSH 1.2.6 版本将所有分析过程设定在本地运

2024-08-29

。包括 121 个扩展 RPM包 与 133 个 DEB包,数量超过了 PGDG 官方仓库提供的扩展数量总和(135 RPM / 109 DEB)。而且,Pigsty 还将EL系统与Debian生态的独有PG扩展插件相互移植,实现了两大发行版的插件生态大对齐。 Pigsty v3 允许用户更

2024-08-09

他众多企业中也获得广泛认可。 文心快码是基于文心大模型,并结合百度二十年编程现场大数据打造。如今全新升级为AI架构师,在保证快速完成基础代码编程的同时,需要更懂业务架构、更懂测试、更懂“领域”知识,能解

2025-04-08

的问题。 AI推理时代即将到来? 今年年初,中国AI公司DeepSeek模型的横空出世在AI领域掀起巨浪,R1模型因其高效推理能力和低成本训练受到全球关注,也对英伟达等芯片企业形成了前所未有的冲击。 英伟达公司年度开发者大

2025-04-22

同类模型小一个数量级的情况下,整体效果对标OpenAI o1和DeepSeek R1,再次证明了基于国产算力训练的全栈自主可控大模型具备登顶业界最高水平的实力和持续创新的潜力。 ✨融入了更多场景复杂类型数据,模型的泛化性也取得

2025-04-07

Alibaba,Ant Design&Vue3,Mybatis-plus,Shiro; 支持 AI 大模型 DeepSeek 和 ChatGPT、Ollama 本地模型;强大的代码生成器让前后端代码一键生成,无需写任何代码!引领 AI 低代码新开发模式:AI 生成 -> OnlineCoding-> 代码生成 -> 手工 ME

2023-12-01

布,其探索 AGI(通用人工智能)的新组织“深度求索(DeepSeek)”继 11 月初发布 Coder 代码模型之后,正式发布通用大语言模型:DeepSeek LLM 67B。模型已完全开源,同时服务已经全面开放内测。 目前 DeepSeek 已同时开源 7B 和 67B 的

2025-03-26

上新!DeepSeek-V3重磅升级 昨夜,DeepSeek-V3迎来一波更新,升级至「DeepSeek-V3-0324」版本。 不仅将模型参数量由原版的671B提升至685B,编程、数学等推理思考能力大幅提升,性能表现可以与Claude 3.5/3.7 Sonnet相媲美。同时,模型的开