科大讯飞今日官宣,讯飞星火 X1 全新升级,号称是“当前业界唯一的基于全国产算力训练的深度推理大模型”,
本次升级有这些关键信息⬇️
✨实现了数学、代码、逻辑推理、文本生成、语言理解、知识问答等通用任务效果显著提升,在模型参数比业界同类模型小一个数量级的情况下,整体效果对标OpenAI o1和DeepSeek R1,再次证明了基于国产算力训练的全栈自主可控大模型具备登顶业界最高水平的实力和持续创新的潜力。
✨融入了更多场景复杂类型数据,模型的泛化性也取得了进步,多个行业任务上展现出了业界领先的能力,在重点行业如教育、医疗、司法等进一步扩大了领先优势。
✨首发快思考、慢思考统一模型,由一个模型同时支持两种思考模式,私有化部署简便;全新升级模型定制优化工具链,支持SFT、强化学习两种模型定制优化方案,定制门槛低。
✨三大核心技术创新——大规模多阶段强化学习训练方法、基于快慢思考的统一训练方法、工程技术系统创新保障基于国产算力的高效长稳训练,助力星火X1全面升级。
✨星火X1 API已同步上线讯飞开放平台,面向广大开发者和企业开放服务。
据介绍,此次星火X1升级,在多个任务上效果继续突破,展现出优异的性能。根据最新测试集评测结果,星火X1在通用任务效果评测中全面对标OpenAI o1和DeepSeek R1,在数学、知识问答等方面表现突出。
星火X1此次全新升级,背后有三大技术创新:
1、大规模多阶段强化学习训练方法:提出基于问题难度的大规模多阶段强化学习方法,在复杂推理、数学、代码、语言理解等场景全面提升模型效果及泛化性;同时提出强化学习动态更新算法,基于样本采样长度动态调整强化学习更新速度,进一步提升深度思考强化学习效率及效果。
2、基于快慢思考的统一训练方法:提出统一模型下快慢思考混合训练方法,充分发挥快慢思考数据相互促进作用,实现基于系统指令控制模型是否深度思考,支撑下游更高效便捷地部署使用。
3、工程技术系统创新保障基于国产算力的高效长稳训练:实现多项工程技术创新,显存动态卸载技术大幅提升长文本推理并发、训推共卡协同实现高效训推资源转换、推理引擎冬眠机制实现快速拉起和恢复,实现国产算力平台上高效和稳定的强化学习训练全流程。
访问 https://xinghuo.xfyun.cn/sparkapi 体验星火X1 API