DeepMind 下一代模型将结合 AlphaGo,以超越 ChatGPT


谷歌旗下研究实验室 DeepMind 的首席执行官 Demis Hassabis 向《连线》杂志表示,他们的工程师正在使用 AlphaGo 技术来开发一个名为 Gemini 的人工智能系统,比 OpenAI ChatGPT 背后的系统更为强大。

Gemini 本质上与 GPT-4 类似,是一个可以处理文本的大语言模型;目前仍在开发当中,大概需要耗费几个月的时间,预计可能要花费数千万美元或数亿美元。OpenAI 首席执行官 Sam Altman 曾在四月份透露,创建 GPT-4 的成本超过了 100 亿美元。

Hassabis 称,他的团队计划把这项技术与 AlphaGo 中使用的技术结合起来,旨在赋予该模型新的能力,如计划或解决问题等。“从高层次上来说,你可以认为 Gemini 结合了 AlphaGo 类系统的一些优势与大型模型令人惊叹的语言能力。我们还有一些非常有趣的创新。”

AlphaGo 基于 DeepMind 开创的强化学习技术,通过让 AlphaGo 反复尝试并接受关于其表现的反馈,学会处理需要选择采取何种行动的棘手问题,比如围棋或视频游戏。它还使用了一种叫做蒙特卡洛树搜索的方法来探索和记忆棋盘上的可能动作。2016 年,AlphaGo 以 4 比 1 的比分击败了世界围棋冠军李世石而声名大振,成为史上首个击败人类职业围棋选手、战胜围棋世界冠军的人工智能机器人。

《连线》杂志方面认为,语言模型的下一个大飞跃可能涉及它们在互联网和计算机上执行更多任务。当 Gemini 完成时,它可以为谷歌在应对 ChatGPT 和其他生成性 AI 技术所带来的竞争威胁中发挥重要作用。

事实上,Gemini 并不是 DeepMind 首次涉足语言模型,该公司在去年曾推出了一个名为 Sparrow 的聊天机器人。Hassabis 一月份透露称,他们考虑将在今年某个时候发布 Sparrow 的私人测试版;但目前上不清楚这些计划是否仍在按计划进行。

除了推动谷歌的 AI 工作进展外,Hassabis 同时也身兼管理未知和潜在严重风险的责任。针对最近一些有关 AI 发展的担忧,Hassabis 则认为,AI 具有非凡的潜在好处,例如在健康或气候等领域的科学发现使得人类必须不停止地发展这项技术。强制暂停是不切实际的、几乎是不可能执行的。如果做得正确,AI 将是对人类最有利的技术,“我们必须大胆地、勇敢地去追求这些。”

但这也并不意味着 Hassabis 主张 AI 的发展要一哄而上。他在上个月与其他知名的 AI 行业专家一起签署了一份声明,警告 AI 有朝一日可能会带来与核战争或大流行病相当的风险。

Hassabis 指出,目前最大的挑战之一是确定能力更强的人工智能的风险可能是什么。他认为应该在领域内进行更多的研究、评估测试等工作,以确定新的人工智能模型的能力和可控性。为此,DeepMind可能会使其系统更容易被外部科学家使用;"我希望看到学术界能够尽早接触到这些前沿模型。"


相關推薦

2023-03-31

在 2014 年,Google 以 4 亿英镑的价格收购了 DeepMind。这使得 DeepMind 成为了 Google 旗下的一个子公司,但它仍然保持着相对独立的运作方式。这也意味着 DeepMind 能够获得 Google 的技术和资源支持,同时也可以开展自己的研究和探索

2023-01-20

也在研发属于自己的对话模型,并宣称即将通过子公司 DeepMind 推出一款与 ChatGPT 竞争的聊天机器人,名为“Sparrow”。 这个名为 Sparrow 的新聊天机器人是去年在一篇研究论文中作为概念验证引入的。DeepMind 首席执行官 Demis Hassabi

2025-03-21

韩国 LG 集团旗下的人工智能 (AI) 研发部门 LG AI Research 宣布推出开源 AI 模型系列 Exaone Deep,并声称其 AI 推理模型在科学理解和数理逻辑方面超越了 OpenAI 的 GPT 模型、谷歌 DeepMind 的 Gemini 和 DeepSeek 等全球竞争对手。 共包括三个

2023-09-12

发之中,最终功能尚不确定。 Meta 最终目标是加速开发下一代生成式人工智能模型,使其能够生成更多类似人类的表达。 长期以来,Meta 一直在采用开源方法公开其大模型产品,是业内众所周知的最大贡献者之一。仅今年它就

2023-08-11

文心一言在三大维度20项指标中综合评分国内第一,超越ChatGPT,其中中文语义理解排名第一,部分中文能力超越GPT-4。 据了解,报告本次评估选取了GPT-4、ChatGPT 3.5、文心一言、通义千问、讯飞星火、Claude、天工7个大语言模型,

2025-03-20

ewton 以推动其机器人角色平台发展的公司之一,该平台为下一代娱乐机器人提供支持,比如此次 GTC 主题演讲中和黄仁勋一起登台、以星球大战® 为灵感设计的富有表现力的 BDX 机器人,就是该平台的成果。 “BDX 机器人只是一

2023-07-27

GLM 技术团队宣布开源最新的代码模型 CodeGeeX2-6B。CodeGeeX2 是多语言代码生成模型 CodeGeeX 的第二代模型,基于 ChatGLM2 架构注入代码实现。 我们希望每一位程序员,都能在自己机器上跑上一个自己的编程助手。为实现这一目标

2023-06-14

Sunak(里希·苏纳克)周一在 London Tech Week 上宣布,Google DeepMind、OpenAI 和 Anthropic 已同意向英国政府开放其人工智能模型,用于研究和安全目的。 具体而言,Google DeepMind、OpenAI 和 Anthropic 将向政府提供 "早期或优先访问" AI 模型

2024-08-10

阿里通义团队开源新一代数学模型Qwen2-Math,包含1.5B、7B、72B三个参数的基础模型和指令微调模型。 Qwen2-Math基于通义千问开源大语言模型Qwen2研发,旗舰模型 Qwen2-Math-72B-Instruct在权威测评集MATH上的得分超越GPT-4o、Claude-3.5-Sonnet、

2025-03-26

搜索开始自我变革。 以下是文章主要内容: 谷歌拥有DeepMind和Google Brain两大顶尖AI实验室,但其管理层对AI技术落地的态度始终谨慎。核心矛盾在于: 技术可靠性:生成式AI的答案准确性尚未达到搜索引擎的要求,可能引发

2024-08-27

取经路上必备技能之一。 自2022年OpenAI公司推出划时代的ChatGPT以来,人工智能领域迎来了井喷式的发展。如今,市场上的AI模型种类繁多,数量之多可达数百,甚至数千。截至本文撰写之日,国内已有180家公司正式推出了自己的

2025-04-03

p; OpenDeepSearch 在开源仓库的 README 中写道:“用开源推理模型与智能代理技术实现搜索民主化”。 OpenDeepSearch 包含两个核心组件,分别用于提供高质量的网络搜索结果,以及基于语义重排和多源整合优化检索效果。 OpenDeepSear

2025-03-28

数据智能公司 Databricks 近日推出了一种全新的大语言模型微调方法 ——TAO(Test-time Adaptive Optimization)。通过运用无标注数据和强化学习,TAO 不仅在降低企业成本方面表现出色,更是在一系列基准测试中取得了令人瞩目的成绩。

2023-06-01

始人 Sam Altman Anthropic 的首席执行官 Dario Amodei、 Google DeepMind 的首席执行官 Demis Hassabis 微软的首席技术官 Kevin Scott 此外还有一大堆涉略或 AI 领域的名校教授、官员记者、社会学家,其中亦有乏国内的清华大学教授、中国