面壁智能开源 MiniCPM-V 2.6 模型，端侧能力全面对标 GPT-4V

2024-08-08 發表於开源资讯

面壁智能宣布「小钢炮」 MiniCPM-V 2.6 模型重磅上新——仅 8B 参数，取得 20B 以下单图、多图、视频理解 3 SOTA 成绩，一举将端侧AI多模态能力拉升至全面对标 GPT-4V 水平。

面壁智能表示，MiniCPM-V 2.6 模型将实时视频理解、多图联合理解、多图 ICL 等能力首次搬上端侧多模态模型，更接近充斥着复杂、模糊、连续实时视觉信息的多模态真实世界，更能充分发挥端侧 AI 传感器富集、贴近用户的优势。

MiniCPM-V 2.6 开源地址：

GitHub: https://github.com/OpenBMB/MiniCPM-V
HuggingFace: https://huggingface.co/openbmb/MiniCPM-V-2_6

相關推薦

MiniCPM 端侧客户端正式发布并开源

2025-07-12

卡加速支持模型： MiniCPM 4.0 8B & 0.5B MiniCPM 3.0 4B MiniCPM-V 2.6 8B（多模态） MiniCPM-V 2.0 2.8B（多模态） MiniCPM-2B-128K MiniCPM-1B-SFT-BF16 配置要求：建议使用英特尔酷睿 ultra7 及以上移动端处理器建议运行内存 32GB

清华&面壁团队队开源 AgentCPM-GUI，面向中文 APP 的端侧 GUI Agent

2025-05-15

近日，清华大学联合面壁智能团队发布了 AgentCPM-GUI —— 一个面向中文 APP 的端侧 GUI Agent，已在中文 Android 场景和开源 Benchmark 取得 SOTA 性能。据介绍，与传统 Agent 相比，GUI Agent 更强调通过图形界面的窗口、按钮而非文本去

AI PC 新突破端侧首次支持 128K 上下文窗口实现 2.2 倍推理优化

2025-06-09

面壁智能正式发布并开源了「面壁小钢炮」端侧系列最新力作——MiniCPM 4.0 模型，实现了端侧可落地的系统级软硬件稀疏化的高效创新。英特尔与面壁智能从模型开发阶段就紧密合作，实现了长短文本多重推理效率的提升，端侧

讯飞星火 V4.0 发布，全面对标 GPT-4 Turbo

2024-06-29

大模型 V4.0，以及在医疗、教育、商业等多个领域的人工智能应用。据介绍，讯飞星火V4.0在8个国际主流测试集中排名第一，并在文本生成、语言理解、知识问答、逻辑推理、数学能力等方面实现对GPT-4 Turbo的整体超越。数据显

deepin 23丨大有智慧，UOS AI应用、功能全面解读

2024-08-24

OS AI API 面向开发者提供接入API，赋能AI应用开发。端侧智能交互体验 UOS AI的技术实现，使得端侧设备能够独立运行复杂的语言模型，为用户提供了快速、可靠的智能交互体验，同时保护了用户数据的隐私和安全。 UOS AI

多语言语料库万卷·丝路 2.0 开源

2025-03-28

上海人工智能实验室（上海AI实验室）联合新华社新闻信息中心、上海外国语大学、外研在线等，发布全新升级的“万卷·丝路2.0”多语言语料库。在“万卷·丝路1.0”的基础上，2.0语料库新增塞尔维亚语、匈牙利语、捷克语3类

腾讯混元开源 0.5B、1.8B、4B、7B 模型

2025-08-05

B、7B，消费级显卡即可运行，适用于笔记本电脑、手机、智能座舱、智能家居等低功耗场景，且支持垂直领域低成本微调。根据介绍，新开源的4 个模型属于融合推理模型，具备推理速度快、性价比高的特点，用户可根据使用

全新高效模型架构！RWKV-7s 闪耀 WAIC

2025-07-30

2025 年 7 月 26-29 日，RWKV 团队受邀参加2025世界人工智能大会（WAIC 2025）, 并在大会公开了 RWKV 最新的高效大模型架构：RWKV-7s，吸引了来自产业界、学术界及媒体的广泛关注与讨论。战略合作广泛落地 7月26日，移远通信宣布与R

蚂蚁集团百灵大模型通过备案，采用 Transfromer 架构

2023-11-07

易有道（“子曰”大模型）、蚂蚁集团（百灵大模型）、面壁智能（“面壁露卡 Luca”）、出门问问（“序列猴子”）、昆仑万维（“天工”大模型）、美团（模型）、知乎（“知海图 AI”模型）、月之暗面（moonshot）、金山办

昆仑万维「天工」大模型正式向全社会开放

2023-11-06

11月3日，昆仑万维“天工”大模型宣布通过《生成式人工智能服务管理暂行办法》备案，面向全社会开放服务！用户在应用商店下载“天工APP”或登陆“天工官网”（www.tiangong.cn）均可直接注册使用。官方介绍称，「天工」

SuperCLUE 10 月榜单：vivo 自研大模型位列国内第一

2023-10-27

能力上的表现，包括专业知识技能、语言理解与生成、AI智能体和安全四大能力维度的上百个任务。本次评测选取了目前国内外最具代表性的20个通用大语言模型。与9月相比，新增了月之暗面的Moonshot、百度的文心一言4.0、科大

打造智能化软件工厂：Gitee Insight 的 DevSecOps 度量实践

2025-05-31

工厂」建设模式，期望实现软件研发的规模化、自动化和智能化。传统的软件研发管理面临诸多挑战：工具和系统的多样化导致数据孤岛，无法实现全局洞察和协同优化；度量体系缺失，企业难以掌握研发效能、质量

PaddleOCR 3.0 发布

2025-05-23

解析，在公开评测集中领先众多开源和闭源方案。发布智能文档理解方案PP-ChatOCRv4：原生支持文心大模型4.5 Turbo，精度相比上一代提升15个百分点。重构部署能力，统一推理接口： PaddleOCR 3.0 融合了飞桨 PaddleX3.0 工

中国信通院发布“2025 智能体十大关键词”

2025-08-08

中国人工智能产业发展联盟副秘书长、中国信息通信研究院（简称“中国信通院”）副总工程师王爱华近日正式发布并解读“2025智能体十大关键词”。十大关键词分别是通用智能体、专用智能体、端侧智能体、企业级智能体、

熱門推薦