xAI 的 Grok 聊天机器人支持实时视觉功能


据 Techcrunch 报道,xAI 已为 Grok 聊天机器人增加视觉功能 Grok Vision,帮助用户解答关于摄像头所见内容的问题。

升级之后,Grok 移动端用户可以将手机对准产品、标志和文件等物体,并提出相关问题。Grok Vision 目前仅支持 iOS 版 Grok 应用。

此外,Grok 今天还推出了包括多语言音频和 Grok 语音模式下的实时搜索等其他新功能。


相關推薦

2024-08-15

期预览版,这是我们之前型号 Grok-1.5 的重大进步,具有聊天、编码和推理方面的先进功能。同时,我们推出了 Grok-2 mini,它是 Grok-2 的一款体型虽小但功能强大的兄弟产品。Grok-2 的早期版本已在 LMSYS 排行榜上以“sus-column-r”的

2023-12-07

在推出首款生成式 AI 聊天机器人 Grok 一个月后,埃隆·马斯克 (Elon Musk) 正在寻求为他的人工智能初创公司 xAI 筹集 10 亿美元资金。 根据美国证券交易委员会(SEC)的一份文件显示,马斯克迄今已从四位不愿透露姓名的投资者那

2025-04-17

xAI 宣布为旗下 AI 聊天助手 Grok 增加全新功能 Grok Studio,可以用于编辑和创建文档,以及基础应用程序。 Grok Studio 将在一个单独的窗口中打开,支持生成文档、代码、报告和浏览器游戏。 生成代码时,Grok Studio 会在“预览”

2025-03-21

整图片的质量、大小或风格,而且请求中的提示会根据"聊天模型"进行修改。 xAI 于 2024 年 10 月推出了自己的 API,在加强培训和开发 Grok 3 等旗舰模型的同时,似乎也在寻找有意义的收入来源。 据报道,该公司正在与投资者会

2025-05-21

之一。 同日,Grok3还通过微软的Azure AI Foundry平台提供支持,与其较小型号Grok3Mini一起,配备可靠的服务水平协议,确保其成为企业的可靠选择。 此外,xAI通过API服务进一步开放Grok3,便于其集成到各种应用中。尽管Grok3在技

2023-11-07

! Grok 的一个独特且根本的优势是它可以通过 𝕏 平台实时了解世界。它还能回答被大多数其他人工智能系统拒绝的尖锐问题。 Grok 基于 xAI 团队于 11 月发布的自研大语言模型 Grok-1。在 xAI 宣布成立后,项目团

2025-03-22

在电动汽车、储能、智能辅助驾驶、人工智能计算及人形机器人等业务板块的最新动态。 马斯克称,特斯拉用于智能辅助驾驶训练的 Cortex 算力中心目前已有超过 5 万块 GPU,且即将突破 10 万块大关,跻身全球前五大超级计算

2023-07-24

的高监管和高风险用例中得到最大程度的应用。 图灵机器人(TuringBot) 图灵机器人是由人工智能驱动的软件机器人,可帮助开发人员构建应用程序。在两到四年内,企业应用的很大一部分可能由这项技术生成。 扩展现

2023-11-08

提示工程,该 SDK 允许实现复杂的提示技术和丰富的分析功能,从而实现网络输出可视化。 IDE 的核心是一个 Python 代码编辑器,它可以与新的 SDK 结合实现复杂的提示。在 IDE 中执行提示时,用户会看到一些有用的分析和建议,

2023-10-26

关注,这是一个令人激动的增强型AI模拟环境,旨在训练机器人在真实场景中进行导航。这一创新的推出对于提升AI模拟环境的仿真程度具有重要意义。【AiBase提要】1. Meta发布Habitat3.0,用于教授机器人与物理世界互动。2. 引入Hab

2025-04-22

。 Always 附加规则现在会在较长的对话中持续生效。 聊天历史记录已移至命令面板。您可以通过聊天中的“显示历史记录按钮”以及 Show Chat History 命令显示。 Review Changes,每次对话结束时都会有一个内置的差异视图,方便

2025-06-04

xAI 签署了合作协议,并在 Telegram 中接入了 xAI 的 AI 聊天机器人 Grok。 端到端加密:消息、通话内容只有通信双方能看到,第三方(包括 X 平台)无法窥探; 阅后即焚:可以设置消息在一定时间后自动删除,比如 10 分钟

2025-04-25

以了解具体情况。但仍然可以使用标准的基于文本的聊天机器人来询问有关图片的问题,也不能让它为你设置 iPhone 的定时闹钟——这些看似基本的功能仍然需要 Siri 来实现。

2025-05-22

Google 搜索中的一个新选项卡,允许用户使用 Gemini AI 聊天机器人进行网络搜索,支持自然语言多轮对话式搜索。 AI Mode 基于 Gemini 2.5 打造,利用"query fan-out"技术将用户问题分解为更小的部分,同时在多样化来源中启动搜索,组