DeepSeek 官方详解 V3 模型“小版本”升级,各项能力全面进阶


DeepSeek-V3 模型近日进行了更新,虽然大家都说更新后的 DeepSeek-V3-0324 强到没边——哪怕叫 DeepSeek V3.5 也不为过,但官方仍低调地称其是“小版本升级”。

下面是官方针对 DeepSeek-V3-0324 发布的更新说明


DeepSeek V3 模型已完成小版本升级,目前版本号 DeepSeek-V3-0324,用户登录官方网页、APP、小程序进入对话界面后,关闭深度思考即可体验。API 接口和使用方式保持不变。

如非复杂推理任务,建议使用新版本 V3 模型,即刻享受速度更加流畅、效果全面提升的对话体验。

模型能力提升一览

推理任务表现提高

新版 V3 模型借鉴 DeepSeek-R1 模型训练过程中所使用的强化学习技术,大幅提高了在推理类任务上的表现水平,在数学、代码类相关评测集上取得了超过 GPT-4.5 的得分成绩。

新版 V3 模型的百科知识(MMLU-Pro, GPQA)、数学(MATH-500, AIME 2024)和代码任务(LiveCodeBench)表现均有提升

前端开发能力增强

在 HTML 等代码前端任务上,新版 V3 模型生成的代码可用性更高,视觉效果也更加美观、富有设计感。

动图展示了一个由模型生成的演示多个小球在指定空间范围内运动的 p5.js 程序,包含若干可以调整重力、摩擦力等参数的滑动按钮,并以赛博朋克风格的 HTML 呈现

中文写作升级

在中文写作任务方面,新版 V3 模型基于 R1 的写作水平进行了进一步优化,同时特别提升了中长篇文本创作的内容质量。

中文搜索能力优化

新版 V3 模型可以在联网搜索场景下,对于报告生成类指令输出内容更为详实准确、排版更加清晰美观的结果。

此外,新版 V3 模型在工具调用、角色扮演、问答闲聊等方面也得到了一定幅度的能力提升。

模型开源

DeepSeek-V3-0324 与之前的 DeepSeek-V3 使用同样的 base 模型,仅改进了后训练方法。私有化部署时只需要更新 checkpoint 和 tokenizer_config.json(tool calls 相关变动)。模型参数约 660B,开源版本上下文长度为 128K(网页端、App 和 API 提供 64K 上下文)。

V3-0324 模型权重下载请参考:

  • Model Scope: https://modelscope.cn/models/deepseek-ai/DeepSeek-V3-0324
  • Huggingface: https://huggingface.co/deepseek-ai/DeepSeek-V3-0324

与 DeepSeek-R1 保持一致,此次我们的开源仓库(包括模型权重)统一采用 MIT License,并允许用户利用模型输出、通过模型蒸馏等方式训练其他模型。


最后,奉上 DeepSeek V3 最新版的免费体验地址,由模力方舟提供:

https://ai.gitee.com/serverless-api/packages/1917?model=DeepSeek-V3&package=1917

模力方舟的 Serverless API 提供了视频生成、文本生成、视觉模型、图像生成与处理、文档处理 / OCR、自动语音识别、语音合成、特征抽取、代码生成、风控识别十大类共 58 款各领域的顶尖开源模型的在线体验和 API 使用。通过购买模型资源包,即可通过极低的价格即可尽享众多主流模型。


相關推薦

2025-03-27

北京时间 3 月 24 日晚,DeepSeek 「突然」发布了模型更新。 但暂时还不是 DeepSeek V4 或 R2,而是 DeepSeek V3 模型的一次更新。 目前,其开源版本目前已经上架开源网站。其开源版本模型体积为 6850 亿参数。 https://huggingface.co/dee

2025-03-27

,方便管理三方应用接入、授权、日志 AI组件支持接入DeepSeek,支持DS推理 PC前端:角色管理支持配置角色人员、菜单资源支持配置移动端菜单、确认删除提示支持明确哪条数据等 devtools工具:创建模型时支持导入视图、

2025-03-22

快手搜索官方宣布已全面接入DeepSeek R1的大模型能力,优化搜索效果与用户体验,未来也会持续探索智能搜索场景的商业化变现能力。 此前,快手已宣布可灵AI已全面接入DeepSeek-R1,在视频生成、图片生成等场景下,用户可通过D

2025-03-27

低服务器资源占用,同时深度融合各种大模型如智谱AI 、DeepSeek 等,开放 linux 一键部署。 它可以提供标准的文本翻译API,一方面可以配合 translate.js 进行使用,另一方面如果你需要文本翻译,完全可以使用它,而不用再

2024-08-09

他众多企业中也获得广泛认可。 文心快码是基于文心大模型,并结合百度二十年编程现场大数据打造。如今全新升级为AI架构师,在保证快速完成基础代码编程的同时,需要更懂业务架构、更懂测试、更懂“领域”知识,能解

2024-08-29

。包括 121 个扩展 RPM包 与 133 个 DEB包,数量超过了 PGDG 官方仓库提供的扩展数量总和(135 RPM / 109 DEB)。而且,Pigsty 还将EL系统与Debian生态的独有PG扩展插件相互移植,实现了两大发行版的插件生态大对齐。 Pigsty v3 允许用户更

2023-12-01

布,其探索 AGI(通用人工智能)的新组织“深度求索(DeepSeek)”继 11 月初发布 Coder 代码模型之后,正式发布通用大语言模型:DeepSeek LLM 67B。模型已完全开源,同时服务已经全面开放内测。 目前 DeepSeek 已同时开源 7B 和 67B 的

2025-03-26

上新!DeepSeek-V3重磅升级 昨夜,DeepSeek-V3迎来一波更新,升级至「DeepSeek-V3-0324」版本。 不仅将模型参数量由原版的671B提升至685B,编程、数学等推理思考能力大幅提升,性能表现可以与Claude 3.5/3.7 Sonnet相媲美。同时,模型的开

2025-03-25

Xinference v1.4.0 发布 🚀! ✨ Gemma-3 模型重磅来袭,DeepSeek-v3 现已支持 Function Calling! 🎉 社区贡献者突破 100+!感谢大家的支持,期待更多伙伴加入贡献代码 💪💖。 🌍 社区版 📌 更新指南 * Pip:pip install 'xinference==1.4.0

2025-03-27

源当日就登顶全球主流AI开源社区Hugging Face的趋势榜。 DeepSeek(深度求索)达成过“开源周”,其在2月末连续五天发布五个代码库,并于近日继续开源上线了升级后的DeepSeek-V3模型。 阶跃星辰则在一个月左右时间开源三款多模态大

2025-03-27

考和推理能力显著提升,AIGC已成为全网增速最快赛道,DeepSeek APP上线次月活跃用户规模突破1.8亿,豆包APP破亿,腾讯元宝、纳米AI搜索在DeepSeek大模型加持下,跻身TOP5。 QuestMobile数据显示,纳米AI搜索、腾讯元宝APP在接入DeepS

2025-04-03

队一直在等待国内有能力支持 AutoDev 的国产模型,直到 DeepSeek V3-0324出现。 AutoDev 开源已有两年时间,如今已经进化成集成度最好的 JetBrains IDE 上的第二代 AI 编程工具,支持主流的 Intellij IDEA、WebStrom、Clion 等 IDE,还有基于 Intel

2025-04-01

AI 基准测试指标上均已领先于 OpenAI、Anthropic、xAI 乃至 DeepSeek。

2025-03-22

p;OpenAI CEO奥特曼在与硅谷知名分析师Ben Thompson对谈中提到DeepSeek。 奥特曼认为DeepSeek确实是个很棒的团队,也做出了很优秀的模型,但他们真正走红的原因,并不完全是模型本身的能力。   “这对我们来说是一个教训,那