马斯克旗下 xAI 发布首个 AI 大模型产品 Grok


马斯克旗下 xAI 团队发布其首个 AI 大模型产品 —— Grok;目前只训练了 2 个月左右的时间,因此尚处于非常早期的测试阶段。

Grok 是一款仿照《银河系漫游指南》设计的人工智能,可以回答几乎任何问题,更难能可贵的是,它甚至可以建议你要问什么问题!

Grok 在回答问题时略带诙谐和反叛,因此如果你讨厌幽默,请不要使用它!

Grok 的一个独特且根本的优势是它可以通过 𝕏 平台实时了解世界。它还能回答被大多数其他人工智能系统拒绝的尖锐问题。

Grok 基于 xAI 团队于 11 月发布的自研大语言模型 Grok-1。在 xAI 宣布成立后,项目团队就用 330 亿个参数训练了一个 LLM 原型(Grok-0),这一早期模型自称与 LLaMA 2 (70B) 能力相当,但只使用了一半的训练资源。

Grok-1 则在此基础上改进了推理和编码能力。Grok-1 是一个基于 Transformer 的自回归模型,经过预先训练以执行 next-token 预测。然后利用人类和早期 Grok-0 模型的广泛反馈对该模型进行微调,初始 Grok-1 的上下文长度为 8192 个 token。

一些评测结果如下所示:

Grok-1 也存在一些局限性,该语言模型不具备独立搜索网络的能力,官方建议在 Grok 中部署搜索工具和数据库可以增强模型的能力和真实性。并警告称,尽管可以访问外部信息源,但该模型仍会产生幻觉。

为了创建 Grok,xAI 团队还构建了一个基于 Kubernetes、Rust 和 JAX 的自定义训练和推理堆栈。

Rust 已被证明是构建可扩展、可靠且可维护的基础架构的理想选择。它提供高性能、丰富的生态系统,并防止分布式系统中通常会发现的大多数错误。鉴于我们的团队规模较小,基础架构的可靠性至关重要,否则维护就会缺乏创新。Rust 让我们充满信心,任何代码修改或重构都可能产生可以在最少监督的情况下运行数月的工作程序。

目前 Grok 仅面向少数美国用户开放测试。

相关阅读:

  • 马斯克宣布成立 xAI 公司

相關推薦

2023-12-07

在推出首款生成式 AI 聊天机器人 Grok 一个月后,埃隆·马斯克 (Elon Musk) 正在寻求为他的人工智能初创公司 xAI 筹集 10 亿美元资金。 根据美国证券交易委员会(SEC)的一份文件显示,马斯克迄今已从四位不愿透露姓名的投资者那

2023-11-08

马斯克旗下AI 公司xAI 宣布推出 PromptIDE 工具,需要使用 X 账户登录。 https://x.ai/prompt-ide/ PromptIDE 是一个用于提示工程和可解释性研究的集成开发环境。它通过 SDK 加速提示工程,该 SDK 允许实现复杂的提示技术和丰富的分析功

2023-07-15

7 月 13 日凌晨,马斯克在 Twitter 宣布由他参与组织及领导的 xAI 公司正式成立。 xAI 称他们成立的目标是“理解宇宙的真实本质”。有关 xAI 的更多信息,将会在 7 月 14 日于 Twitter Spaces (Twitter 的语音直播功能)透露并接受听

2023-10-11

DataCanvas公司完成总融资额3亿元D1轮融资。中国电子集团旗下中电智慧基金、华民投、中国太平旗下太平创新、浙江东方旗下东方嘉富等央国企旗下投资机构,以及卓源资本等专注人工智能赛道的知名财务投资机构参与本轮融资

2023-07-18

埃隆·马斯克 (Elon Musk) 在日前举行的 Twitter Spaces 音频会议概述了他新成立的 xAI 公司的目标称,xAI 的首要目标是建立一个良好的 AGI(通用人工智能),达到“了解宇宙的真实本质”的目的。 针对一些人对 AGI 概念的恐惧,马斯

2023-07-14

的目标是“削弱 OpenAI 目前的主导地位”。 延伸阅读 马斯克宣布成立 xAI 公司 GPT-4 模型架构泄露:包含 1.8 万亿参数、采用混合专家模型 (MoE)

2023-09-08

课程 开始学习 8 月 31 日,百度、字节、商汤、中科院旗下紫东太初、百川智能、智谱华章等 8 家企业 / 机构的大模型产品已经首批通过《生成式人工智能服务管理暂行办法》备案,可正式上线面向公众提供服务。 具体包括:

2023-09-29

力行业人工智能创新平台及自主可控电力大模型正式公开发布。 电力行业人工智能创新平台提供模型即服务(MaaS),支持模型快速迭代开发,并支撑电力人工智能资源面向全社会开放共享。百度提供了昆仑芯AI芯片、飞桨框架

2023-09-05

首个开源 Llama 2 的中文语言大模型;零一万物则是李开复旗下的大模型公司。 “多模态大型语言模型近来备受关注。不过,大多数研究都集中在视觉-语言多模态模型上,这些模型在遵循视觉和语言指令方面具有很强的能力。

2023-10-28

维AI业务矩阵之一的AI游戏也取得了重要进展。昆仑万维旗下Play for Fun游戏工作室自研的首款AI游戏《Club Koala》于8月25日在德国科隆国际游戏展亮相。Club Koala 引入了AI NPC,并通过Atom系统控制NPC行为,使AI NPC拥有自我意识及记忆

2023-07-08

的大会主题演讲中,华为常务董事、华为云CEO张平安重磅发布盘古大模型3.0和昇腾AI云服务。其中,盘古大模型3.0围绕“行业重塑”“技术扎根”“开放同飞”三大创新方向,持续打造核心竞争力,为行业客户、伙伴及开发者提

2023-04-01

马斯克 (Elon Musk)、苹果联合创始人 Steve Wozniak、图灵奖得主 Yoshua Bengio 等上千名行业高管和专家签署了一封公开信,呼吁所有 AI 实验室立即暂停对比 GPT-4 更强大的 AI 系统的训练至少 6 个月。并表示,这种暂停应该是公开

2024-01-23

,高级别自动驾驶示范区实现160平方公里连片运行,全国首个数据基础制度先行区启动建设,数字经济增加值占地区生产总值比重达42.9%。 殷勇说,今年,北京将加快发展新质生产力。实施制造业重点产业链高质量发展行动,

2023-11-17

日,李彦宏在深圳举行的西丽湖论坛上表示,百度已经对旗下各产品线进行了AI原生化重构,百度每100行代码,20行就由AI完成。 他表示,大模型是基础底座,类似操作系统不会太多,重复开发大模型是对基础资源的浪费。文心