阶跃星辰发布 StepFun-Prover-Preview 系列模型,用于形式化定理证明


阶跃星辰(StepFun)发布了 StepFun-Prover-Preview 系列模型,包括 7B 和 32B 两个版本,专门用于形式化定理证明(formal theorem proving)。

据介绍,StepFun-Prover-Preview 专为数学推理设计,通过工具集成推理(tool-integrated reasoning)实现高效的形式化定理证明,支持 Lean 4 证明语言。

论文地址:https://arxiv.org/abs/2507.20199

性能方面,StepFun-Prover-Preview-7B 在 miniF2F-test (pass@1) 基准测试中,其表现与 DeepSeek-Prover-V2-671B 和 Kimina-Prover-72B 持平。更强大的 StepFun-Prover-Preview-32B 模型在 miniF2F-test (pass@1) 上超越了所有已知同类模型 4% 以上。该系列模型还具备类人证明细化能力,非常适合推动数学推理领域研究的科研人员。

模型地址:https://huggingface.co/stepfun-ai/StepFun-Prover-Preview-32B


相關推薦

2025-04-30

阶跃星辰昨天发布并开源了全新的通用图像编辑模型 Step1X-Edit,上线次日就在海外开源社区平台 Hugging Face 登上 Spaces 趋势热榜,该榜单反映了模型实际应用价值的受欢迎程度。 Step1X-Edit 提供强大的改图能力,可以帮用户完成

2025-08-05

机构: 阿里(9个)、月之暗面(2个)、智谱(2个)、阶跃星辰(1个)、字节跳动(2个)、昆仑万维(2个)、智源研究院(1个)、中国电信人工智能研究院(1个)、蚂蚁集团(4个)、快手(1个)、捏Ta(1个)、磐石(3个

2025-07-26

阶跃星辰宣布发布新一代基础大模型 Step3,主打多模态推理。 根据介绍,这是阶跃星辰首个全尺寸、原生多模态推理模型。在国产芯片32K上下文推理效率最高可达DeepSeek R1的300%,在英伟达H800芯片将推理效率提升了70%以上。该模

2025-05-01

2-671B。一个专注于数学定理证明的大语言模型,专门针对形式化数学证明任务进行优化。 新模型具有以下特点: 模型规模巨大:参数量约为671B(6710亿参数),这从模型分片数量(163个)和每个分片大小(约4.3GB)可以看

2025-04-11

复旦大学和阶跃星辰将要出一款端到端多模态 SVG 生成模型:OmniSVG,核心是支持从简单图标到复杂动漫角色的生成。 OmniSVG 主页:https://omnisvg.github.io/ 论文地址:https://arxiv.org/abs/2504.06263v1 OmniSVG 支持三种生成模式:

2025-03-21

阶跃星辰宣布开源图生视频模型 Step-Video-TI2V,一款基于30B参数Step-Video-T2V训练的图生视频模型,支持生成102帧、5秒、540P分辨率的视频,具备运动幅度可控和镜头运动可控两大核心特点,同时天生具备一定的特效生成能力。 公

2025-08-02

跑得快 Qwen3-8B / Qwen3-4B / Qwen3-0.6B 国产开源的 Qwen3 系列,从轻量级到中型参数都有,支持「思考模式」与「对话模式」自由切换,还能写代码、讲英文、做推理。模型权重与 API 已全面开放,商用也不用担心授权问题。

2025-05-15

阶跃星辰StepFun AI团队发布了Step1X-3D,一个完全开源的、专注于高保真度和可控性的纹理3D资产生成框架。该框架旨在解决现有3D生成方法在纹理质量、几何细节和可控性方面的不足。 Step1X-3D通过多阶段优化流程,结合了先进的

2025-07-23

得了突破,但他们仍在继续推进 AlphaGeometry 和 AlphaProof 等形式化系统。他们相信,将自然语言流畅性与形式化语言中的严谨、可验证推理相结合的 Agent,将成为数学家、科学家和研究人员的宝贵工具。 此次成果由 Thang Luong 领导

2024-01-13

中国电信宣布将自研星辰 AI 大型模型全面开源,公开其底层代码、算法逻辑及其预制的各种基础大模型、开发模块、训练工具等核心产品能力。 用户既可以直接调用大模型,也可以根据自身业务需求对大模型进行微调或个性化

2025-03-27

码库,并于近日继续开源上线了升级后的DeepSeek-V3模型。 阶跃星辰则在一个月左右时间开源三款多模态大模型,其最新开源的是图生视频模型Step-Video-TI2V,支持生成的视频具备运动幅度可控和镜头运动可控两大核心特点,同时自

2024-08-08

虎”(智谱AI、零一万物、百川智能、MiniMax、月之暗面、阶跃星辰),正以惊人的速度,跨过200亿元的估值大关。 2024年8月5日,据彭博社报道,月之暗面刚交割一轮超过3亿美元的融资,投后估值高达33亿美元。 前不久,王小

2024-07-27

一轮融资,即智谱AI与月之暗面。此外,新晋大模型公司阶跃星辰也跻身AI独角兽序列。今年6月,该公司被传正在进行一轮估值约20亿美元的新融资,阿里在投资者之列。 相关数据显示,今年上半年,招投标市场已经产生了498次

2025-06-10

RWKV 创始人彭博刚刚在社交平台发布了一篇文章,主要讨论 DeltaNet 和 RWKV-7 在基线测试中的问题。   来源: https://zhuanlan.zhihu.com/p/1915054612559426430 https://github.com/BlinkDL/zoology 事件主角 DeltaNet 和 RWKV 均