面壁智能开源 MiniCPM-V 2.6 模型,端侧能力全面对标 GPT-4V


面壁智能宣布「小钢炮」 MiniCPM-V 2.6 模型重磅上新——仅 8B 参数,取得 20B 以下单图、多图、视频理解 3 SOTA 成绩,一举将端侧AI多模态能力拉升至全面对标 GPT-4V 水平。

面壁智能表示,MiniCPM-V 2.6 模型将实时视频理解、多图联合理解、多图 ICL 等能力首次搬上端侧多模态模型,更接近充斥着复杂、模糊、连续实时视觉信息的多模态真实世界,更能充分发挥端侧 AI 传感器富集、贴近用户的优势。

MiniCPM-V 2.6 开源地址:

  • GitHub: https://github.com/OpenBMB/MiniCPM-V
  • HuggingFace: https://huggingface.co/openbmb/MiniCPM-V-2_6

相關推薦

2024-08-24

OS AI API 面向开发者提供接入API,赋能AI应用开发。 端侧智能交互体验 UOS AI的技术实现,使得端侧设备能够独立运行复杂的语言模型,为用户提供了快速、可靠的智能交互体验,同时保护了用户数据的隐私和安全。   UOS AI

2024-06-29

大模型 V4.0,以及在医疗、教育、商业等多个领域的人工智能应用。 据介绍,讯飞星火V4.0在8个国际主流测试集中排名第一,并在文本生成、语言理解、知识问答、逻辑推理、数学能力等方面实现对GPT-4 Turbo的整体超越。数据显

2023-11-07

易有道(“子曰”大模型)、蚂蚁集团(百灵大模型)、面壁智能(“面壁露卡 Luca”)、出门问问(“序列猴子”)、昆仑万维(“天工”大模型)、美团(模型)、知乎(“知海图 AI”模型)、月之暗面(moonshot)、金山办

2023-11-06

11月3日,昆仑万维“天工”大模型宣布通过《生成式人工智能服务管理暂行办法》备案,面向全社会开放服务! 用户在应用商店下载“天工APP”或登陆“天工官网”(www.tiangong.cn)均可直接注册使用。 官方介绍称,「天工」

2023-10-27

能力上的表现,包括专业知识技能、语言理解与生成、AI智能体和安全四大能力维度的上百个任务。 本次评测选取了目前国内外最具代表性的20个通用大语言模型。与9月相比,新增了月之暗面的Moonshot、百度的文心一言4.0、科大

2024-08-27

之一。 自2022年OpenAI公司推出划时代的ChatGPT以来,人工智能领域迎来了井喷式的发展。如今,市场上的AI模型种类繁多,数量之多可达数百,甚至数千。截至本文撰写之日,国内已有180家公司正式推出了自己的AI大模型服务。在

2024-09-27

Meta 今天发布了 Llama 3.2 系列开源模型,其中包括小型和中型视觉 LLMs(11B 和 90B),以及适合边缘和移动设备的小型纯文本模型(1B 和 3B),包括预训练和指令调整版本。 LLaMA 3.2 支持同时处理文本、图像和视频,能够理解并生

2024-07-02

代开源原生的DataOps 平台,助力企业在大数据和云时代,智能化地完成多数据源、多云及信创环境的数据集成、调度开发和治理,以提高企业解决数据问题的效率,提升企业分析洞察能力和决策能力。 联系方式 公司网站: www.wha

2022-09-08

视觉任务,针对分类检测分割三大任务,基于内容风控、智能零售、智能监控、同图匹配、商品类目预测、商品检测、商品属性识别、工业质检等应用场景,基于阿里巴巴内部的业务实践和服务阿里云外部客户的经验,筛选复现

2024-01-23

,会上透露,2023,年,北京获准向公众开放的生成式人工智能大模型产品占全国近一半。今年,北京将推动人工智能模型对标国际先进水平,加快在政务、医疗、工业、生活服务等领域应用。 北京市市长殷勇作政府工作报告时

2023-10-25

端性能表现最强; 第二,AI 赋能,成为整个生态的“智能大脑”,能够为用户提供主动服务; 第三,更加便捷高效的连接; 第四,实现全端隐私安全坚固防护。 在最底层的系统内核层,小米将自研的 Vela 系统内

2023-12-02

业用户而言,「天工SkyAgents」则可以按需拼装成企业IT、智能客服、企业培训、HR、法律顾问等众多个性化的应用,并支持一键服务部署,确保其在不同业务系统中的无缝接入。 AI Agent一般译为“人工智能体”或“人工智能代

2023-03-20

OpenAI 刚发布了 GPT-4,百度预热已久的人工智能生成式对话产品也终于亮相了。昨天下午,文心一言 (ERNIE Bot)—— 百度全新一代知识增强大语言模型、文心大模型家族的新成员,正式在百度总部 “挥手点江山” 会议室里发布

2024-08-15

频模型类别和视频模型 CogVideoX 🎥   - 多模态模型:MiniCPM-v-2_6 🌐   - SenseVoice 语音模型 🎤 - 新功能 🚀   - 大幅提升 sglang 引擎的性能和吞吐 ⚡   - 分布式下允许先启动 worker 再启动 supervisor 🖥️🔄 - BUG 修复