360 智脑推出 Light-IF 系列模型


360智脑团队宣布推出全新的Light-IF系列模型,这一创新框架旨在显著提升大型语言模型(LLM)在复杂指令遵循方面的能力。随着人工智能技术的不断进步,尽管LLM在数学、编程等领域已经展现出了卓越的推理能力,但在遵循复杂指令方面仍存在不足。为了解决这一问题,360智脑团队提出了以预览-自检式推理和信息熵控制为核心的Light-IF框架。

Light-IF框架通过五个关键环节来提升模型性能:难度感知指令生成、Zero-RL强化学习、推理模式提取与过滤、熵保持监督冷启动、熵自适应正则强化学习。这一框架的提出,旨在破解当前推理模型中存在的“懒惰推理”现象,即模型在思考阶段仅复述指令而不主动检查约束是否被满足,导致指令执行不准确的问题。

在实验中,Light-IF系列模型在SuperCLUE、IFEval、CFBench及IFBench四个中文和跨语言指令遵循基准上均取得了显著提升。特别是32B版本的Light-IF-32B,其在SuperClue得分达到了0.575,比下一个最佳模型高出13.9个百分点。此外,参数规模仅为1.7B的Light-IF-1.7B在SuperClue和IFEval上的表现甚至超过了Qwen3-235B-A22B等体量更大的模型。

360智脑团队表示,Light-IF系列模型的推出,不仅为开源社区提供了一套可复现的完整路线和配套的开源代码,而且全系模型将陆续开放,供社区使用、对比与复现。同时,训练中使用的冷启动数据集也将同步开放。

此外,360与SuperCLUE联合推出的中文精确指令遵循测评基准SuperCLUE-CPIFOpen也将在Github上开放,便于研究者评测模型的中文精确指令遵循能力。


相關推薦

2023-09-22

么开发 30 岁就要被干掉? 360 公司官方今日宣布,360 智脑大模型全面接入 360 全家桶,正式面向公众开放。 360智脑大模型全景 用户可通过 ai.360.com 一站式登录体验 360 智脑 App、360 搜索、360 安全浏览器、LoRA360、

2024-08-14

软件商店再添新成员!近日,豆包、通义、360AI搜索、360智脑、360智绘、昆仑万维天工AI、澜舟智库等重磅AI产品登陆麒麟软件商店人工智能专区,涵盖了AI对话、AI写作、AI绘图、AI搜索等多个领域,为用户带来更加丰富、智能的

2024-08-01

起、用得好 "。 相关阅读:“开源信徒”周鸿祎开源360智脑大模型

2023-11-07

型)、上海人工智能实验室(书生通用大模型)、“360 智脑”等等。 挑战 ChatGPT,国产有这 8 款 AI 大模型产品 据悉,今年 8 月 15 日正式施行的《生成式人工智能服务管理暂行办法》 ,提供具有舆论属性或者社会动员能力

2025-06-04

赵怡岭、@鲍勃 01 有话题的技术 1、通义实验室语音团队推出 OmniAudio 技术,可直接从 360° 视频生成 FOA 空间音频 5 月 29 日,阿里通义大模型公布了「空间音频生成」模型——OmniAudio。据通义团队介绍,OmniAudio 能够直接从 360°

2023-11-08

一言,讯飞星火,商汤日日新,腾讯混元,百川 53B ,360 智脑 开源模型:Llama2 ,ChatGLM2 ,AquilaChat 7B ,Bloomz 7B 等,后续还将开放更多 文生图、图生图、超分辨率、黑白图片上色等功能,集成 Stable Diffusion 模型,支持 SDXL 1.0

2025-05-08

能力得到全面提升,在多个benchmark上表现优秀。本次开源推出的360Zhinao3-7B-O1.5模型,不止是数学和科学的单点模型,在通用能力上表现优秀,可以在端侧应用上发挥更大价值。 本次升级的360Zhinao3-7B模型,在模型参数量不变的情

2025-07-24

能推动国产芯片持续改进。 H20 是英伟达针对中国市场推出的 H100 简化版,采用 Hopper 架构和 CoWoS 封装技术,但性能差距明显。周鸿祎分析,H20 更适合 AI 推理任务,而推理对芯片要求较低,无需高速互联和集群部署。在此领

2025-05-27

升级,360AI浏览器围绕搜索、阅读与助手三大核心场景,推出多项原生智能功能。AI搜索系统支持语音、图片及自然语言模糊输入,自动理解意图、跨平台检索,并结构化呈现精准答案,实现“找东西一步到位”。 同时,浏览器

2022-11-20

19 日 - 2022 年 11 月 17 日)。 Fred 曾领导了 IBM System/360 系列计算机和 OS/360 软件支持包的开发,该系统帮助彻底改变了数据处理行业。之后他又出版了《人月神话》一书,记录总结了在 IBM 期间领导上述项目开发时的经验;该

2025-08-07

公司正致力于打造L3和L4级别的高阶智能体。 为此,360已推出“智能体工厂”,该平台能够支持从L1到L4级别的智能体及智能体蜂群的构建,旨在让每个企业和个人都能根据自身需求,定制专属的L3级推理型智能体和L4级智能体蜂

2023-07-22

基于此模型打造了 ChatGLM(chatglm.cn)。 此外,智谱 AI 还推出了认知大模型平台 Bigmodel.ai,包括 CodeGeeX 和 CogView 等产品,提供智能API服务。智谱 AI 由清华大学计算机系唐杰教授创立,团队核心成员曾参与清华大学与智源研究院

2025-04-25

方便自身生活。 纳米AI产品负责人梁志辉介绍,MCP让大模型可调用工具,大家熟悉的Deepseek大模型过去只能做文本理解、内容生成的事情,但现在在纳米AI客户端里给DeepSeek 加上MCP 工具,DeepSeek 能帮你作图、编辑视频,或者调

2025-07-24

在 2025 中国互联网大会上,当被问及大模型在落地应用过程中可能存在的风险时,360集团创始人周鸿祎深入剖析了人工智能时代下网络安全面临的全新挑战。他指出,相较于传统的IT系统漏洞和数据隐私泄露问题,大模型带来的