上海创智学院领衔的团队发布了 AI 超智能系统:ASI-Arch,其成功设计彻底颠覆了这一认知。该系统基于先进的大模型技术,构建了高度自主的多智能体研究框架,能够完全独立地进行从问题识别、假设生成、实验设计到结果验证的完整科学研究流程。
- 论文标题: AlphaGo Moment for Model Architecture Discovery
- 系统开源: https://github.com/GAIR-NLP/
- ASI-Arch网站地址: https://gair-nlp.github.io/ASI-Arch/
据介绍,在长达数月的自主研究过程中,ASI-Arch 系统展现出了令人震撼的研究能力。系统共进行了 1,773 次独立实验,累计消耗超过 20,000 GPU 小时的计算资源,在无人干预的情况下,ASI-ARCH 自主发现了 106 个新颖且性能卓越的线性注意力架构,这些架构在多个基准测试中超越了如 Mamba2 和 Gated DeltaNet 等强大的基线模型。
这一研究规模和效率远超传统人类研究团队的能力范围。
图:AI 自主进行了 1,773 次科研探索
ASI-ARCH 系统成功发现了 106 个全新的线性注意力机制架构,每一个在性能指标上都显著超越了现有的人类设计方案。这些发现的重要性不仅在于性能提升,更在于设计理念的创新。系统提出的许多架构设计原理和优化策略,即使是该领域的顶级专家也承认此前从未考虑过。这表明 AI 系统已经具备了超越人类认知边界的创新能力。