讯飞星火 X1 全新升级,基于全国产算力训练的深度推理大模型


科大讯飞今日官宣,讯飞星火 X1 全新升级,号称是“当前业界唯一的基于全国产算力训练的深度推理大模型”,

本次升级有这些关键信息⬇️

✨实现了数学、代码、逻辑推理、文本生成、语言理解、知识问答等通用任务效果显著提升,在模型参数比业界同类模型小一个数量级的情况下,整体效果OpenAI o1和DeepSeek R1,再次证明了基于国产算力训练的全栈自主可控大模型具备登顶业界最高水平的实力和持续创新的潜力。

✨融入了更多场景复杂类型数据,模型的泛化性也取得了进步,多个行业任务上展现出了业界领先的能力,在重点行业如教育、医疗、司法等进一步扩大了领先优势

首发快思考、慢思考统一模型,由一个模型同时支持两种思考模式,私有化部署简便;全新升级模型定制优化工具链,支持SFT、强化学习两种模型定制优化方案,定制门槛低。

三大核心技术创新——大规模多阶段强化学习训练方法、基于快慢思考的统一训练方法、工程技术系统创新保障基于国产算力的高效长稳训练,助力星火X1全面升级。

星火X1 API已同步上线讯飞开放平台,面向广大开发者和企业开放服务。


据介绍,此次星火X1升级,在多个任务上效果继续突破,展现出优异的性能。根据最新测试集评测结果,星火X1在通用任务效果评测中全面对标OpenAI o1和DeepSeek R1,在数学、知识问答等方面表现突出。

星火X1此次全新升级,背后有三大技术创新:

1、大规模多阶段强化学习训练方法:提出基于问题难度的大规模多阶段强化学习方法,在复杂推理、数学、代码、语言理解等场景全面提升模型效果及泛化性;同时提出强化学习动态更新算法,基于样本采样长度动态调整强化学习更新速度,进一步提升深度思考强化学习效率及效果。

2、基于快慢思考的统一训练方法:提出统一模型下快慢思考混合训练方法,充分发挥快慢思考数据相互促进作用,实现基于系统指令控制模型是否深度思考,支撑下游更高效便捷地部署使用。

3、工程技术系统创新保障基于国产算力的高效长稳训练:实现多项工程技术创新,显存动态卸载技术大幅提升长文本推理并发、训推共卡协同实现高效训推资源转换、推理引擎冬眠机制实现快速拉起和恢复,实现国产算力平台上高效和稳定的强化学习训练全流程。

访问 https://xinghuo.xfyun.cn/sparkapi 体验星火X1 API


相關推薦

2024-06-29

科大讯飞在北京发布基于全国首个国产万卡算力集群“飞星一号”的讯飞星火大模型 V4.0,以及在医疗、教育、商业等多个领域的人工智能应用。 据介绍,讯飞星火V4.0在8个国际主流测试集中排名第一,并在文本生成、语言理解

2024-07-05

自带运营管理后台,开箱即用。集成了 OpenAI, Azure, ChatGLM,讯飞星火,文心一言等多个平台的大语言模型。集成了 MidJourney 和 Stable Diffusion AI绘画功能。 主要特性: 完整的开源系统,前端应用和后台管理系统皆可开箱即用。

2024-08-14

继百度文心一言、讯飞星火、博思白板、雅意等AI产品上架后,麒麟软件商店再添新成员!近日,豆包、通义、360AI搜索、360智脑、360智绘、昆仑万维天工AI、澜舟智库等重磅AI产品登陆麒麟软件商店人工智能专区,涵盖了AI对话

2025-04-02

看! 稳定:比磐石更可靠 独创永动机对话协议,基于 M/M/1 队列模型优化,永远都会回应你的请求! 任何设备都可以跑,模型本体智能自我复制很多份,根本挂不掉! 帅气:颜值担当 你看我的标,多好看~

2023-08-11

本次评估选取了GPT-4、ChatGPT 3.5、文心一言、通义千问、讯飞星火、Claude、天工7个大语言模型,围绕生成质量、使用与性能、安全与合规三大维度,全面考察大语言模型上下文理解、中文语义理解、误导信息识别、逻辑推理、内

2023-07-08

、不同时延、不同响应速度的行业多样化需求。同时提供全新能力集,包括NLP大模型的知识问答、文案生成、代码生成,以及多模态大模型的图像生成、图像理解等能力,这些技能都可以供客户和伙伴企业直接调用。无论多大参

2025-04-01

百度宣布发布业界首个基于全新互相关注意力(Cross-Attention)的端到端语音语言大模型,实现超低时延与超低成本,在电话语音频道的语音问答场景中,调用成本较行业均值下降约50%-90%。 文小言宣布率先接入该模型,同时带来

2023-10-27

比,新增了月之暗面的Moonshot、百度的文心一言4.0、科大讯飞的星火V3.0、vivo的vivoLM和阿里云的Qwen-14B。 评测发现,国内第一梯队大模型格局已基本形成,在过去11个月的成绩令人振奋,头部几个中文大模型已经与GPT3.5极为接近

2024-07-09

近日,科大讯飞股份有限公司(简称“科大讯飞”)签署了openKylin社区CLA(Contributor License Agreement贡献者许可协议),正式加入openKylin开源社区。 科大讯飞成立于1999年,是亚太地区知名的智能语音和人工智能上市企业,公司

2024-08-02

及编译接入等功能。 下面将重点介绍飞桨3.0版本架构全新重大升级,这次升级主要包含以下模块: 1)高扩展中间表示 PIR,通过打造全架构统一的中间表示,突破框架层各模块壁垒,提升飞桨在科学计算、编译优化、大模型

2025-04-02

应用领域的复杂需求又倒逼、激励基础层、模型层的算力升级与算法优化,带动了我国生成式人工智能全栈技术的创新发展。2017年至2024年间,我国生成式人工智能全栈公开专利共167,634项,专利申请年均复合增长31.6%,专利申请

2024-07-05

理解,硅基流动所在的AI Infra层,是上接AI应用层、下接算力芯片层的中间层,相当于大模型时代的“操作系统”。如何让大模型训练与推理更高效,充分释放底层硬件的潜力,降低生成式AI应用开发的门槛与成本,正是AI Infra需

2024-08-16

界、美好生活。 大模型在快速发展的同时也带来了全新挑战,比如大模型参数规模越来越来大,算力瓶颈问题日益突出。在这一背景下,作为 AI 的关键基础设施——深度学习平台应该具备什么样的能力? 百度飞桨深度学

2024-08-10

lin 2.0版本已适配Intel最新14代Meteor Lake平台AI PC,支持最新讯飞-星火大模型V4.0版本,并面向openKylin社区用户提供免费试用账号。此外,openKylin 2.0版本上线了一系列实用的AI功能,包括AI助手、智能文生图、智能模糊搜索、智能剪