马斯克旗下 xAI 发布首个 AI 大模型产品 Grok


马斯克旗下 xAI 团队发布其首个 AI 大模型产品 —— Grok;目前只训练了 2 个月左右的时间,因此尚处于非常早期的测试阶段。

Grok 是一款仿照《银河系漫游指南》设计的人工智能,可以回答几乎任何问题,更难能可贵的是,它甚至可以建议你要问什么问题!

Grok 在回答问题时略带诙谐和反叛,因此如果你讨厌幽默,请不要使用它!

Grok 的一个独特且根本的优势是它可以通过 𝕏 平台实时了解世界。它还能回答被大多数其他人工智能系统拒绝的尖锐问题。

Grok 基于 xAI 团队于 11 月发布的自研大语言模型 Grok-1。在 xAI 宣布成立后,项目团队就用 330 亿个参数训练了一个 LLM 原型(Grok-0),这一早期模型自称与 LLaMA 2 (70B) 能力相当,但只使用了一半的训练资源。

Grok-1 则在此基础上改进了推理和编码能力。Grok-1 是一个基于 Transformer 的自回归模型,经过预先训练以执行 next-token 预测。然后利用人类和早期 Grok-0 模型的广泛反馈对该模型进行微调,初始 Grok-1 的上下文长度为 8192 个 token。

一些评测结果如下所示:

Grok-1 也存在一些局限性,该语言模型不具备独立搜索网络的能力,官方建议在 Grok 中部署搜索工具和数据库可以增强模型的能力和真实性。并警告称,尽管可以访问外部信息源,但该模型仍会产生幻觉。

为了创建 Grok,xAI 团队还构建了一个基于 Kubernetes、Rust 和 JAX 的自定义训练和推理堆栈。

Rust 已被证明是构建可扩展、可靠且可维护的基础架构的理想选择。它提供高性能、丰富的生态系统,并防止分布式系统中通常会发现的大多数错误。鉴于我们的团队规模较小,基础架构的可靠性至关重要,否则维护就会缺乏创新。Rust 让我们充满信心,任何代码修改或重构都可能产生可以在最少监督的情况下运行数月的工作程序。

目前 Grok 仅面向少数美国用户开放测试。

相关阅读:

  • 马斯克宣布成立 xAI 公司

相關推薦

2023-12-07

在推出首款生成式 AI 聊天机器人 Grok 一个月后,埃隆·马斯克 (Elon Musk) 正在寻求为他的人工智能初创公司 xAI 筹集 10 亿美元资金。 根据美国证券交易委员会(SEC)的一份文件显示,马斯克迄今已从四位不愿透露姓名的投资者那

2023-11-08

马斯克旗下AI 公司xAI 宣布推出 PromptIDE 工具,需要使用 X 账户登录。 https://x.ai/prompt-ide/ PromptIDE 是一个用于提示工程和可解释性研究的集成开发环境。它通过 SDK 加速提示工程,该 SDK 允许实现复杂的提示技术和丰富的分析功

2024-08-15

API 平台向开发人员提供这两种模型。 “我们很高兴发布 Grok-2 的早期预览版,这是我们之前型号 Grok-1.5 的重大进步,具有聊天、编码和推理方面的先进功能。同时,我们推出了 Grok-2 mini,它是 Grok-2 的一款体型虽小但功能强

2023-07-15

7 月 13 日凌晨,马斯克在 Twitter 宣布由他参与组织及领导的 xAI 公司正式成立。 xAI 称他们成立的目标是“理解宇宙的真实本质”。有关 xAI 的更多信息,将会在 7 月 14 日于 Twitter Spaces (Twitter 的语音直播功能)透露并接受听

2023-10-11

DataCanvas公司完成总融资额3亿元D1轮融资。中国电子集团旗下中电智慧基金、华民投、中国太平旗下太平创新、浙江东方旗下东方嘉富等央国企旗下投资机构,以及卓源资本等专注人工智能赛道的知名财务投资机构参与本轮融资

2023-07-18

埃隆·马斯克 (Elon Musk) 在日前举行的 Twitter Spaces 音频会议概述了他新成立的 xAI 公司的目标称,xAI 的首要目标是建立一个良好的 AGI(通用人工智能),达到“了解宇宙的真实本质”的目的。 针对一些人对 AGI 概念的恐惧,马斯

2023-07-14

的目标是“削弱 OpenAI 目前的主导地位”。 延伸阅读 马斯克宣布成立 xAI 公司 GPT-4 模型架构泄露:包含 1.8 万亿参数、采用混合专家模型 (MoE)

2024-08-08

根据36氪的独家报道,李开复创办的AI大模型独角兽公司「零一万物」已经完成新一轮融资,金额达数亿美元。 知情人士表示,此轮融资参与方包括某国际战投、东南亚财团等多家机构。 「零一万物」成立于2023年5月,由创新

2024-08-09

阿里云宣布域名产品服务完成AI化系列改造,推出首个基于通义大模型的域名AI应用,升级后的阿里云万网可通过输入品牌名称和所属行业大模型批量生成创意域名。 同时,大模型将会自动进行语义解析,输出域名含义,并通过

2023-09-08

课程 开始学习 8 月 31 日,百度、字节、商汤、中科院旗下紫东太初、百川智能、智谱华章等 8 家企业 / 机构的大模型产品已经首批通过《生成式人工智能服务管理暂行办法》备案,可正式上线面向公众提供服务。 具体包括:

2024-08-16

权、供应链安全主动权,2022年,由开放原子开源基金会旗下的欧拉社区所代表的中国服务器操作系统根社区,以及由统信软件主导运营的deepin深度社区所代表的中国桌面操作系统根社区先后投入建设。 所谓Linux操作系统根社区

2023-09-29

力行业人工智能创新平台及自主可控电力大模型正式公开发布。 电力行业人工智能创新平台提供模型即服务(MaaS),支持模型快速迭代开发,并支撑电力人工智能资源面向全社会开放共享。百度提供了昆仑芯AI芯片、飞桨框架

2024-09-30

2024年9月19日,飞致云旗下开源项目MaxKB成功加入Gitee平台主导的GVP计划,入选2024年GVP——Gitee最有价值开源项目。MaxKB也是继MeterSphere、DataEase和1Panel之后,飞致云旗下第四个入选GVP的开源项目。 ▲图1 MaxKB入选2024年Gitee最有价

2024-08-14

、AI会议纪要等等,学习办公,效率翻倍。 豆包 抖音旗下的人工智能产品,基于字节跳动推出的自研豆包大模型。豆包电脑版以“豆包”主智能体为核心,集合AI搜索、写作、阅读总结、图像生成功能于一体,能够在工作、