快手开源"Auto Think"大模型,可根据问题自动调节思考深度


快手 Kwaipilot 团队宣布开源 KwaiCoder-AutoThink-preview 自动思考大模型,针对近期深度思考大模型存在的“过度思考”问题进行了深入研究。

团队不仅提出了一种全新的自动思考模型训练范式,还基于传统强化学习算法(GRPO),创新性地提出了带有过程监督的强化学习方法 Step-SRPO,以进一步提升模型在复杂任务中的表现。

该模型融合了”思考“和”非思考“能力,并具备根据问题难度自动切换思考形态的能力。通过进行这种思考形态训练,模型在多个“思考”和“非思考”评测榜单上均实现了性能提升,其中在部分代码和数学类的任务上,开启自动思考模式下的模型得分提升高达20分左右。更有趣的是,在部分榜单中,即使模型没有开启思考模式,受益于更优的推理形态,性能也有小幅上涨。

Kwaipilot 团队表示,未来将基于 preview 版本模型,进一步增强推理能力,支持更完善的思考中工具使用能力,并将全部技术细节、训练方法开源。

模型开源地址:https://huggingface.co/Kwaipilot/KwaiCoder-AutoThink-preview


相關推薦

2025-04-26

字节跳动方面宣布,其火山引擎边缘大模型网关已全面支持豆包 1.5・深度思考模型。 即日起,用户可以在边缘大模型网关使用豆包全系列模型,并享受 200 万 tokens 免费额度,只要在网关访问密钥使用了本次新增的豆包大模型

2025-04-22

称是“当前业界唯一的基于全国产算力训练的深度推理大模型”, 本次升级有这些关键信息⬇️ ✨实现了数学、代码、逻辑推理、文本生成、语言理解、知识问答等通用任务效果显著提升,在模型参数比业界同类模型小一个

2023-09-29

负责研发的电力行业人工智能创新平台及自主可控电力大模型正式公开发布。 电力行业人工智能创新平台提供模型即服务(MaaS),支持模型快速迭代开发,并支撑电力人工智能资源面向全社会开放共享。百度提供了昆仑芯AI芯

2024-07-07

在2024世界人工智能大会上,快手高级副总裁、主站业务与社区科学负责人盖坤宣布,快手文生图大模型可图(Kolors)正式开源。该模型基于数十亿图文对进行训练,支持256的上下文token数,支持中英双语,技术细节参考技术报告

2025-05-09

决多样化复杂问题。 据介绍,基于阿里自研的推理大模型和夸克每天处理数十亿次的搜索请求,夸克 “深度搜索” 拥有超高的“搜商”。首先,它能够深入分析用户提出的复杂问题,逐步分析问题并进行充分地思考,从而

2025-05-23

推出大规模、可漫游的3D场景生成模型。 腾讯重申拥抱开源,已实现图像、视频、3D、文本等全模态开源,未来将持续推出多尺寸模型并开源更多多模态基础模型及插件。 腾讯也正在推广其AI IDE“Genie IDE”,目前已开放预约

2025-04-01

模型。其中核心链路的模型和技术,智谱将于4月14日正式开源。 「AutoGLM沉思」体现了智谱对AI Agent的核心理解:让机器不仅能够思考,还能主动行动,实现「边想边干」的目标。 这一能力的实现依赖于三个关键特性: 深度

2025-05-10

快手推出了基于多模态大模型的创新方案 KuaiMod,旨在优化短视频平台生态并提升用户体验。 KuaiMod 的核心在于其对短视频内容的质量判别。传统的内容判别方法往往依赖于静态规则和人工标注,成本高且难以应对用户偏好的动

2025-05-22

Context Protocol, MCP)定义的原生 SDK 支持,以便更轻松地与开源工具集成。 详情查看:https://mp.weixin.qq.com/s/NCcmWcgZGEY6Qrg3yZSRCg

2025-04-17

stc 更新至 1.81 版本; 仓库更新了部分用户反馈第三方开源软件包; qemu 适配 LoongArch64 架构; glibc icu 合入 GB18030-2022 国家标准支持。 【DDE】 新增智能镜像源功能可通过控制中心更新-更新设置进行管理; 控制

2025-04-19

功能。理想汽车通过实验发现,在多轮对话场景下,部分开源深度思考模型存在强行关联用户上文无关输入的问题,导致回复中包含不相关信息,影响用户体验。而MindGPT3.0则能够自主对历史对话进行反思,有效过滤与当前问题

2023-12-02

模型技术与工程能力最强,布局最全面,同时全身心投入开源社区建设的企业之一。

2025-05-15

的模型微调技术而闻名,其WizardLM和WizardCoder系列模型在开源社区具有广泛影响力。此次加入腾讯,预计将增强腾讯在自研大模型领域的实力。   推荐阅读 腾讯重构混元大模型研发体系,加大 AI 投入 腾讯混元自研深度思

2025-03-20

透露,腾讯于数月前重组AI团队,聚焦产品创新及深度的模型研发,并加大了对原生AI产品的研发和营销力度。 马化腾表示:“数月前,我们重组了AI团队以聚焦于快速的产品创新及深度的模型研发、增加了AI相关的资本开支、