上海 AI 实验室联合多所高校推出 PonderV2 预训练方法与模型


上海人工智能实验室(上海 AI 实验室)联合香港大学、浙江大学和中国科学技术大学宣布共同推出 PonderV2 通用 3D 预训练方法与模型。

Ponder系列在通用3D方面实现三个“首次”:首次同时支持室内外使用场景;首次同时支持点云、体素和多视角图像输入;首次在不同语义层级的下游任务上达成最佳性能。在通用人工智能的研究领域,教导计算机深度理解三维世界是当前重要研究目标之一,并将为各种AI实际应用奠定坚实基础。PonderV2代码同时开源。

PonderV2具有深度理解和感知三维真实世界的能力,并为广泛的三维应用提供强大支持。在预训练方面,该预训练与模型具备以下四项核心优势。

统一的预训练方式

得益于统一的基于三维渲染的预训练方式,PonderV2从大量数据中学习并获得高效的三维理解。在包含室内场景理解和室外自动驾驶应用场景、三维场景语义分割及三维场景目标检测、全数据和数据受限情况等11项基准的评测中,相较于目前已发表的同类型成果,PonderV2表现出当前最优预训练性能。

PonderV2预训练模型的下游任务雷达图,PonderV2在11项不同任务和数据集中相比已发表文章达到最优预训练性能。

同时支持室内外场景3D任务

PonderV2在室内场景和室外自动驾驶场景任务评测中均获得了当前最优效果。在室内场景中,该模型在ScanNet和S3DIS等公开排行榜上获得多项第一;而在室外场景下,PonderV2在nuScenes数据集上获得了3D检测和3D分割的最优预训练性能。评测结果同时表明,使用同一个三维预训练框架,解决各种类型的应用场景,正逐步成为可能。

灵活支持多种输入模态

PonderV2使用三维神经渲染模拟人类的三维感知,并能灵活地支持不同的输入模态,统一地将它们渲染到2D图像上进行训练,从而把2D和3D世界连接在一起。面对三维任务中多种多样的数据形式,PonderV2提供了一种简单而有效的通用预训练范式,同时支持点云、体素和多视角图像输入。

PonderV2可以灵活支持不同的输入数据模态

同时支持高层级语义和底层重建下游任务

PonderV2为首个以重建三维场景并渲染的方式实现高效特征学习的模型。使用该预训练方式获得的三维特征,不仅在三维的高层次语义任务(如三维物体检测、分割)中获得了最优结果,同样被证明在底层三维任务,如三维重建,也有明显效果提升。

PonderV2可以同时赋能下游的高层语义任务和底层重建任务

论文地址:https://arxiv.org/abs/2310.08586


相關推薦

2023-03-02

要有: 联合中国移动研究院建立AI基础模型服务开放实验室,面向行业应用场景的听觉内容分析等领域进行大模型研究与应用; 联合浪潮信息建立大模型开源生态联合实验室,共同推动国产AI硬件底层软件的完善; 联合中

2023-08-16

据联盟”(以下简称“语料数据联盟”),上海人工智能实验室(上海AI实验室)于8月14日宣布,联合中央广播电视总台、人民网、国家气象中心、中国科学技术信息研究所、上海报业集团、上海文广集团等语料数据联盟成员,

2023-06-17

的示范性应用场景,推动产业集聚。 目前上海人工智能实验室、上海交通大学、中国商飞上海飞机设计研究院、中国科学院上海药物研究所、云从科技等首批22家单位正式入驻创新中心,将联合昇思社区进行大模型创新与AI产学

2023-09-08

(日日新大模型)、MiniMax(ABAB大模型)、上海人工智能实验室(书生通用大模型) 下面是 8 款 AI 大模型(及产品)的简介和链接: 百度(文心一言) 文心一言(英文名:ERNIE Bot)是百度全新一代知识增强大语言模型

2023-11-04

深言科技与清华大学 NLP 实验室共同研发的语鲸LingoWhale-8B模型已面向社会开源。 深言科技(DeepLang AI)由清华大学计算机系自然语言处理实验室(THUNLP)与北京智源人工智能研究院(BAAI)共同孵化,是国内最早开展大模型研发

2023-06-25

高利用率。MosaicML 也是少数几个能够使用 Nvidia H100 GPU 的实验室,相比以往,这使得每 GPU 的吞吐量增加了 2.4 倍以上,带来更快的完成时间。 300 亿参数这是一个在大模型领域经常看到的数字,300 亿参数为什么这么特殊呢?Mosai

2023-05-01

MiniRBT 是实用性强、适用面广的中文小型预训练模型,由哈工大讯飞联合实验室推出。  

2023-06-14

的发展和创新。峰会现场,共建人工智能框架生态倡议、上海昇思AI框架&大模型创新中心启动及首批伙伴入驻、昇思社区理事会成立、全球首个全模态大模型发布、水分子基础科研探索等系列重磅内容公布。 当前人工智能领

2023-11-07

初大模型)、上海 MiniMax(ABAB 大模型)、上海人工智能实验室(书生通用大模型)、“360 智脑”等等。 挑战 ChatGPT,国产有这 8 款 AI 大模型产品 据悉,今年 8 月 15 日正式施行的《生成式人工智能服务管理暂行办法》 ,

2023-07-08

练效能可以调优到业界主流GPU的1.1倍。 华为诺亚方舟实验室主任姚骏介绍盘古基础大模型全栈创新 算力是训练大模型的基础。在本次大会上,张平安宣布单集群2000P Flops算力的昇腾AI云服务在华为云的乌兰察布和贵安AI算

2023-04-01

上千名行业高管和专家签署了一封公开信,呼吁所有 AI 实验室立即暂停对比 GPT-4 更强大的 AI 系统的训练至少 6 个月。并表示,这种暂停应该是公开的和可验证的,且包括所有关键参与者。如果不能迅速实施这种暂停,政府应介

2023-07-25

未智能科技有限公司(知未智能KDF)产品与技术发布会于上海召开。会上发布了该公司从零训练的大语言模型——“JIANG”大语言模型,以及基于该模型研发的一系列产品,包括KDF智讯、KDF绝未、KDF中书等。 知未智能成立于201

2023-10-10

本处理能力。这个局面如今被打破。 近日,贾佳亚团队联合MIT发布的新技术和新模型悄然登上各大开源网站的热榜:hugging face热榜第一、paperwithcode热度第一,Github全部python项目热度第五、github stars一周内破千,Twitter上的相关

2023-04-04

del Studio 在云端提供了 Cerebras Wafer-Scale Cluster。” Cerebras 联合创始人兼首席软件架构师 Sean Lie 称,由于很少有公司有资源在内部训练真正的大型模型,因此此次发布意义重大。“通常需要成百上千个 GPU,将七个经过全面训练的