阶跃星辰(StepFun)发布了 StepFun-Prover-Preview 系列模型,包括 7B 和 32B 两个版本,专门用于形式化定理证明(formal theorem proving)。
据介绍,StepFun-Prover-Preview 专为数学推理设计,通过工具集成推理(tool-integrated reasoning)实现高效的形式化定理证明,支持 Lean 4 证明语言。
论文地址:https://arxiv.org/abs/2507.20199
性能方面,StepFun-Prover-Preview-7B 在 miniF2F-test (pass@1) 基准测试中,其表现与 DeepSeek-Prover-V2-671B 和 Kimina-Prover-72B 持平。更强大的 StepFun-Prover-Preview-32B 模型在 miniF2F-test (pass@1) 上超越了所有已知同类模型 4% 以上。该系列模型还具备类人证明细化能力,非常适合推动数学推理领域研究的科研人员。
模型地址:https://huggingface.co/stepfun-ai/StepFun-Prover-Preview-32B