快手开源"Auto Think"大模型，可根据问题自动调节思考深度

2025-06-05 發表於开源资讯

快手 Kwaipilot 团队宣布开源 KwaiCoder-AutoThink-preview 自动思考大模型，针对近期深度思考大模型存在的“过度思考”问题进行了深入研究。

团队不仅提出了一种全新的自动思考模型训练范式，还基于传统强化学习算法（GRPO），创新性地提出了带有过程监督的强化学习方法 Step-SRPO，以进一步提升模型在复杂任务中的表现。

该模型融合了”思考“和”非思考“能力，并具备根据问题难度自动切换思考形态的能力。通过进行这种思考形态训练，模型在多个“思考”和“非思考”评测榜单上均实现了性能提升，其中在部分代码和数学类的任务上，开启自动思考模式下的模型得分提升高达20分左右。更有趣的是，在部分榜单中，即使模型没有开启思考模式，受益于更优的推理形态，性能也有小幅上涨。

Kwaipilot 团队表示，未来将基于 preview 版本模型，进一步增强推理能力，支持更完善的思考中工具使用能力，并将全部技术细节、训练方法开源。

模型开源地址：https://huggingface.co/Kwaipilot/KwaiCoder-AutoThink-preview

相關推薦

快手开源多模态大模型 Kwai Keye-VL

2025-06-28

快手宣布并开源其最新自研的多模态大语言模型 Kwai Keye-VL。根据介绍，Kwai Keye-VL 以 Qwen3-8B 语言模型为基础，引入了基于开源 SigLIP 初始化的 VisionEncoder，能够深度融合并处理文本、图像、视频等多模态信息，凭借其创新的自适

中国开源 AI 社区 7 月高亮时刻回顾

2025-08-05

、中国电信人工智能研究院（1个）、蚂蚁集团（4个）、快手（1个）、捏Ta（1个）、磐石（3个）、上海交通大学（1个）、腾讯（1个）、上海人工智能实验室（1个）、复旦大学（1个）。 1、阿里（9个）：编程模型Qwen3-Coder-30B-A3

豆包大模型 1.6 发布

2025-06-12

火山引擎正式发布了豆包大模型1.6、豆包·视频生成模型 Seedance 1.0 pro、豆包·语音播客模型。全新发布的豆包大模型1.6系列由三个模型组成： doubao-seed-1.6：All-in-One 的综合模型，是国内首个支持256K 上下文的思考模型，支

豆包 1.5 · 深度思考模型上线边缘大模型网关

2025-04-26

字节跳动方面宣布，其火山引擎边缘大模型网关已全面支持豆包 1.5・深度思考模型。即日起，用户可以在边缘大模型网关使用豆包全系列模型，并享受 200 万 tokens 免费额度，只要在网关访问密钥使用了本次新增的豆包大模型

讯飞星火 X1 全新升级，基于全国产算力训练的深度推理大模型

2025-04-22

称是“当前业界唯一的基于全国产算力训练的深度推理大模型”，本次升级有这些关键信息⬇️ ✨实现了数学、代码、逻辑推理、文本生成、语言理解、知识问答等通用任务效果显著提升，在模型参数比业界同类模型小一个

电力行业首个自主可控的大模型发布

2023-09-29

负责研发的电力行业人工智能创新平台及自主可控电力大模型正式公开发布。电力行业人工智能创新平台提供模型即服务（MaaS），支持模型快速迭代开发，并支撑电力人工智能资源面向全社会开放共享。百度提供了昆仑芯AI芯

快手文生图大模型可图宣布开源

2024-07-07

在2024世界人工智能大会上，快手高级副总裁、主站业务与社区科学负责人盖坤宣布，快手文生图大模型可图（Kolors）正式开源。该模型基于数十亿图文对进行训练，支持256的上下文token数，支持中英双语，技术细节参考技术报告

夸克 AI 超级框上线「深度搜索」功能

2025-05-09

决多样化复杂问题。据介绍，基于阿里自研的推理大模型和夸克每天处理数十亿次的搜索请求，夸克 “深度搜索” 拥有超高的“搜商”。首先，它能够深入分析用户提出的复杂问题，逐步分析问题并进行充分地思考，从而

百度发布 AI 智能搜索工具“梯子AI ”

2025-08-27

u.com/）。 “梯子AI”定位为智能搜索助手，依托多个大模型能力开发而成，主打无广告智能搜索，整合深度思考、资源检索及影视娱乐功能（号称海量资源）。应用描述：梯子AI 是百度融合多个大模型能力开发的 AI 智能

百度开源最新思考模型 ERNIE-4.5-21B-A3B-Thinking

2025-09-10

UMMIT 深度学习开发者大会2025在京举行。大会现场，百度开源了最新思考模型ERNIE-4.5-21B-A3B-Thinking，该模型是在ERNIE-4.5-21B-A3B基础上训练的深度思考模型，在内容创作、逻辑推理、数学计算、代码生成与工具调用等多个任务中表

腾讯混元大模型矩阵全面升级并推出多款新品

2025-05-23

推出大规模、可漫游的3D场景生成模型。腾讯重申拥抱开源，已实现图像、视频、3D、文本等全模态开源，未来将持续推出多尺寸模型并开源更多多模态基础模型及插件。腾讯也正在推广其AI IDE“Genie IDE”，目前已开放预约

快手开源 KuaiMod，多模态 AI 专治各种劣质内容

2025-05-10

快手推出了基于多模态大模型的创新方案 KuaiMod，旨在优化短视频平台生态并提升用户体验。 KuaiMod 的核心在于其对短视频内容的质量判别。传统的内容判别方法往往依赖于静态规则和人工标注，成本高且难以应对用户偏好的动

智谱正式发布「AutoGLM沉思」

2025-04-01

模型。其中核心链路的模型和技术，智谱将于4月14日正式开源。「AutoGLM沉思」体现了智谱对AI Agent的核心理解：让机器不仅能够思考，还能主动行动，实现「边想边干」的目标。这一能力的实现依赖于三个关键特性：深度

快手高级副总裁盖坤兼任可灵AI技术部负责人

2025-08-19

快手宣布高级副总裁盖坤兼任可灵 AI 技术部负责人，继续向 CEO 程一笑汇报，进一步强化可灵 AI 在快手战略中的地位。据了解，盖坤自 2020 年加入快手后，主导推荐算法、视频生成大模型等技术研发，并推动可灵 AI 成为全球

熱門推薦