阶跃星辰发布最强开源多模态推理模型 Step3


阶跃星辰宣布发布新一代基础大模型 Step3,主打多模态推理。

根据介绍,这是阶跃星辰首个全尺寸、原生多模态推理模型。在国产芯片32K上下文推理效率最高可达DeepSeek R1的300%,在英伟达H800芯片将推理效率提升了70%以上。该模型将于7月31日向全球开源。

此外,阶跃星辰宣布与上海国有资本投资有限公司达成深度战略合作,并透露上海国投将参与阶跃星辰的新一轮融资。

阶跃星辰创始人、CEO姜大昕表示,阶跃的商业化的成果体现在了收入数字上,基于上半年的高速增长,公司将全年的冲刺目标定在10亿元。

会上,阶跃还将联合近10家芯片厂商和算力平台成立模新生态创新联盟。


相關推薦

2025-04-11

复旦大学和阶跃星辰将要出一款端到端多模态 SVG 生成模型:OmniSVG,核心是支持从简单图标到复杂动漫角色的生成。 OmniSVG 主页:https://omnisvg.github.io/ 论文地址:https://arxiv.org/abs/2504.06263v1 OmniSVG 支持三种生成模式:

2025-04-30

阶跃星辰昨天发布并开源了全新的通用图像编辑模型 Step1X-Edit,上线次日就在海外开源社区平台 Hugging Face 登上 Spaces 趋势热榜,该榜单反映了模型实际应用价值的受欢迎程度。 Step1X-Edit 提供强大的改图能力,可以帮用户完成

2025-03-21

阶跃星辰宣布开源图生视频模型 Step-Video-TI2V,一款基于30B参数Step-Video-T2V训练的图生视频模型,支持生成102帧、5秒、540P分辨率的视频,具备运动幅度可控和镜头运动可控两大核心特点,同时天生具备一定的特效生成能力。 公

2025-04-25

继开源 Skywork-R1V 后,昆仑万维宣布再开源多模态推理模型的全新升级版本 —— Skywork-R1V 2.0(简称 R1V 2.0) 。 公告称,Skywork-R1V 2.0 是当前最均衡兼顾视觉与文本推理能力的开源多模态模型,该多模态模型在高考理科难题的深度

2025-05-15

阶跃星辰StepFun AI团队发布了Step1X-3D,一个完全开源的、专注于高保真度和可控性的纹理3D资产生成框架。该框架旨在解决现有3D生成方法在纹理质量、几何细节和可控性方面的不足。 Step1X-3D通过多阶段优化流程,结合了先进的

2025-03-27

码库,并于近日继续开源上线了升级后的DeepSeek-V3模型。 阶跃星辰则在一个月左右时间开源三款多模态大模型,其最新开源的是图生视频模型Step-Video-TI2V,支持生成的视频具备运动幅度可控和镜头运动可控两大核心特点,同时自

2025-07-11

在今天召开的直播活动中,马斯克正式发布了 Grok 4,声称是全球最强 AI 模型,在处理学术问题上的表现已达到博士级别。整场发布会时长 53 分钟,马斯克演示了 Grok 4 模型的多模态功能、更快的推理能力等诸多新特性。 Grok 4

2025-07-24

le_thinking 下 reasoning_content 输出异常 🏢 企业版更新 发布 0.1.2 版本,增强 Prometheus 指标监控能力,max_tokens 默认支持最长 tokens。 修复多模态模型在 vLLM 与 Transformers 推理时的兼容问题,提升分布式部署稳定性。 我们感

2024-01-13

中国电信宣布将自研星辰 AI 大型模型全面开源,公开其底层代码、算法逻辑及其预制的各种基础大模型、开发模块、训练工具等核心产品能力。 用户既可以直接调用大模型,也可以根据自身业务需求对大模型进行微调或个性化

2024-05-27

了业内首个支持30种方言自由混说的语音识别大模型——星辰超多方言语音识别大模型,可同时识别理解粤语、上海话、四川话、温州话等30多种方言,是目前国内支持最多方言的语音识别大模型。 据悉,中国电信人工智能

2023-12-02

今天,阿里云举办通义千问发布会,开源通义千问720亿参数模型Qwen-72B。 地址:https://modelscope.cn/models/qwen/Qwen-72B/ 据介绍,Qwen-72B在10个权威基准测评创下开源模型最优成绩,成为业界最强开源大模型,性能超越开源标杆Llama 2-70

2025-04-18

上海人工智能实验室(上海 AI 实验室)升级并开源了通用多模态大模型书生·万象3.0(InternVL3)。 根据介绍,通过采用创新的多模态预训练和后训练方法,InternVL3 多模态基础能力全面提升,在专家级基准测试、多模态性能全面

2024-04-18

近日中国电信开源了12B参数规模星辰语义大模型TeleChat-12B。相较于1月开源的7B版本,内容、性能和应用等方面整体效果提升了30%。其中,多轮推理、安全问题等领域提升超40%。另外,据了解,中国电信将于年内开源千亿级参数大

2025-07-10

阿里巴巴通义实验室开源了一款名为HumanOmniV2的多模态推理模型,旨在解决现有模型在全局上下文理解不足和推理路径简单化的问题。该模型能够更精准地捕捉图像、视频、音频中的隐藏信息,从而更好地理解人类的复杂意图和