新研究提出 AI 自主架构发现系统 ASI-Arch


上海创智学院领衔的团队发布了 AI 超智能系统:ASI-Arch,其成功设计彻底颠覆了这一认知。该系统基于先进的大模型技术,构建了高度自主的多智能体研究框架,能够完全独立地进行从问题识别、假设生成、实验设计到结果验证的完整科学研究流程。

  • 论文标题: AlphaGo Moment for Model Architecture Discovery
  • 系统开源: https://github.com/GAIR-NLP/
  • ASI-Arch网站地址: https://gair-nlp.github.io/ASI-Arch/

据介绍,在长达数月的自主研究过程中,ASI-Arch 系统展现出了令人震撼的研究能力。系统共进行了 1,773 次独立实验,累计消耗超过 20,000 GPU 小时的计算资源,在无人干预的情况下,ASI-ARCH 自主发现了 106 个新颖且性能卓越的线性注意力架构,这些架构在多个基准测试中超越了如 Mamba2 和 Gated DeltaNet 等强大的基线模型。

这一研究规模和效率远超传统人类研究团队的能力范围。

图:AI 自主进行了 1,773 次科研探索

ASI-ARCH 系统成功发现了 106 个全新的线性注意力机制架构,每一个在性能指标上都显著超越了现有的人类设计方案。这些发现的重要性不仅在于性能提升,更在于设计理念的创新。系统提出的许多架构设计原理和优化策略,即使是该领域的顶级专家也承认此前从未考虑过。这表明 AI 系统已经具备了超越人类认知边界的创新能力。


相關推薦

2023-10-26

人工智能研发预算用于人工智能安全,并强调了寻求具体研究突破以支持人工智能安全工作的紧迫性。呼吁开发人工智能的大型私营公司以及政府政策制定者和监管机构采取特别行动。 与其对人工智能能力的投资相当的是,

2025-06-17

w we built our multi-agent research system(我们如何构建多智能体研究系统)》,分享了他们开发「Research」功能时构建多智能体的工程挑战及从中学到的经验教训。 据介绍,名为“Research”(研究)的新功能核心是一个多智能体系统。

2025-07-24

段提供反馈,既能精准指导特定想法,又能宏观调控整体研究方向。 在方案设计阶段,Intern·Agent通过方案设计智能体、Coding评审智能体,快速将抽象想法转化为详细实施方案,并进一步结合领域约束与计算资源限制对方案进

2025-04-02

用和生态互为支撑的稳定发展体系。之江实验室作为新型研究机构,则展现了基础研究与应用创新协同、快速推进的发展态势。 图2 生成式人工智能主要创新主体AI专利高质量发展能力分布 四是多模态及推理技术专利的加速

2025-03-26

力,算力对经济的巨大拉动作用已经显现。中国信息通信研究院发布的《中国算力发展指数白皮书(2023年)》显示,算力每投入1元钱,就将带动3至4元的GDP增长。 在数字经济大省浙江,去年数字经济核心产业增加值突破1万亿

2025-06-13

连接模式、以及智能体的自主组织与协作能力。 同时,研究揭示了当前互联网架构对Agentic Web发展的三大挑战:数据孤岛限制智能体决策质量、人机界面阻碍智能体交互效率、以及标准协议缺失阻碍智能体协作。针对这些挑战

2023-04-06

微软亚洲研究院和浙江大学的研究团队近日发布的一篇论文——《HuggingGPT: Solving AI Tasks with ChatGPT and its Friends in HuggingFace》介绍了一个大模型协作系统。 论文地址:https://arxiv.org/abs/2303.17580 该系统提出了一种让 LLM 充当控制

2025-05-20

包括图像、视频、多模态模型,甚至“世界模型”等新兴研究方向。这些技术不仅服务于搜索、YouTube和Gemini,更扩展了我们的科研深度与前沿探索。 问:关于芯片,外界普遍认为英伟达几乎垄断了AI市场。谷歌自研的TPU是否能

2023-03-27

学教授邹鹏,共创软件联盟理事长张玉志,国防科技大学研究员吴庆波,先进操作系统创新中心(天津)总经理韩乃平,原科技部高技术研究发展中心研究员嵇智源,开源专家、LVS创始人章文嵩,中南大学自动化学院院长阳春华,

2023-04-25

Home Security Heroes 是一家专注于安全研究的公司,近日他们发布了一项报告,主要研究的内容是 AI 需要花费多长时间可以破解你的密码,以此来提高大家对密码安全的认知。 此次测试,Home Security Heroes 使用了一个名为 PassGAN 的 AI

2023-05-27

办。本届大会在中国计算机学会、国家工业信息安全发展研究中心指导下,由openGauss开源社区主办,联合海量数据、云和恩墨、南大通用共同举办。 会上,openGauss持续聚焦内核与架构创新,推出DataPod+DataKit组合和第三代智能优

2025-07-08

最新研究发现,在问题中附加如“猫”等无关文本片段,可以系统性地误导大型语言模型,显著降低其推理准确性。 一篇题为《猫会混淆推理大模型》的新研究论文揭示了大型语言模型在推理能力上的脆弱性。研究人员引入了

2025-05-27

t Studio 低代码平台为企业定制智能体提供了有力支持。像研究员智能体、项目管理智能体等,已在微软内部 “智能体 100” 活动中得到实际应用,实现了礼品查询、员工反馈汇总等场景功能,充分展示了 AI 智能体在提升办公效

2023-03-28

获得清华大学优秀博士学位论文奖,2013年加入微软亚洲研究院从事大规模机器学习平台的研发工作。 2015年至2016年底,专注于搭建基于异构集群的深度学习平台,项目荣获微软亚洲研究院院长特别奖 (top 1%)。2017年创立北京