Gemini API 支持抓取 URL

2025-08-20 發表於开源资讯

谷歌宣布其Gemini API中的URL Context工具已正式支持直接抓取 URL 内容，无需额外脚本或中间步骤。

Gemini API 提供了 URL Context 功能，允许你在请求中直接嵌入网页链接，模型会自动访问并解析网页内容。支持的内容类型包括：

文本网页（HTML、JSON、TXT 等）
PDF 文件
图片（PNG、JPEG、WebP 等）

不支持的内容：YouTube 视频、Google Docs、付费墙内容等。

✅ 使用示例（Python SDK）

from google import genai
from google.genai import types

client = genai.Client()

response = client.models.generate_content(
model="gemini-2.5-flash",
contents=[
"总结这篇文章的内容：",
types.Part.from_uri(
uri="https://example.com/article",
mime_type='text/html'
)
]
)
print(response.text)

使用限制

每次最多支持 20 个 URL
单个 URL 内容大小上限为 34MB
抓取内容会计入 输入 Tokens 费用

如果你使用 Gemini CLI，也可以通过 web_fetch 工具快速抓取网页，例如：

gemini-cli web-fetch --prompt "总结 https://example.com/article 的主要内容"

该工具会自动识别提示中的 URL 并调用 Gemini API 抓取内容。

如你正在开发基于 Gemini 的应用，URL Context 功能已足够替代传统的爬虫或 HTML 解析器，大幅提升开发效率。

相关链接

https://ai.google.dev/gemini-api/docs/url-context
https://colab.sandbox.google.com/github/google-gemini/cookbook/blob/main/quickstarts/Grounding.ipynb#url-context

相關推薦

AI 编程工具 Roo Code 3.25 发布，，引入自定义斜杠命令、集成 Gemini 网页工具

2025-08-01

自己的斜杠命令，以自动化重复性工作流。集成Gemini网页工具：集成了Gemini的网页访问能力，允许模型进行Google搜索和分析URL内容，以提供更准确、实时的信息。图像支持与OCR：read_file工具现在支持读取和分析多种格

jsoup 1.16.1 发布，Java HTML 解析器

2023-05-06

内容包括： Improvements 在Jsoup.connect(String url)中，原生支持在路径或查询字符串中包含 Unicode 字符的 URL，而无需由调用者进行转义。#1914 在没有父节点的节点上调用Node.remove()现在是不可行的，会出现验证错误。#1898 Bug Fixes

Joomla 5.3 正式发布！构建更高效的网站管理体验

2025-06-09

HTML电子邮件模板增强功能升级：邮件模板视图现在支持模板参数调用，允许更灵活的自定义邮件内容技术细节：通过PR #44896实现，文档说明请参考此处应用场景：可直接在后台配置个性化邮件模板，提升品牌一致

“全球最强 AI 模型” Grok 4 正式发布

2025-07-11

的多模态能力将使该模型能与 OpenAI 的 GPT-5o 和 Google 的 Gemini 2.5 Pro 展开更激烈的竞争。Grok 4 未来某个时候可能会支持视频。语音功能： Grok 4 的语音功能（Grok 4 Voice）拥有自然、酷似真人的声音，且干扰更少。实时网络访

Gemini 原生文本转语音 (TTS) 功能达到生产就绪状态

2025-07-23

谷歌Gemini模型的原生文本转语音（TTS）功能已适用于规模化的生产环境，该功能目前支持Gemini 2.5 Flash和Gemini 2.5 Pro两个模型。 https://x.com/OfficialLoganK/status/1947328086577492309 据官方人员透露，这项强大的功能适用于多种用例

word GPT Plus V0.5.0 发布，利用 ChatGPT 辅助工作的 word 加载项全新 UI

2025-06-08

容 DeepSeek 和其他 OpenAI 兼容接口） Azure OpenAI API Google Gemini Pro API Ollama（用于本地部署） Groq API 内置模板：翻译（支持 40+ 种语言）文本润色和改进学术写作增强内容摘要生成语法检查自定义选项：

word GPT Plus V1.1.0 利用 AI 辅助工作的 word 加载项，新增 Agent 模式

2025-07-16

容 DeepSeek 和其他 OpenAI 兼容接口） Azure OpenAI API Google Gemini Pro API Ollama（用于本地部署） Groq API Agent模式：支持多步骤分析和结果合成可配置的分析步骤限制内置模板：翻译（支持 40+ 种语言）文本润

谷歌 Gemini 增加 Imagen 选项并开放 llms.txt

2025-07-24

谷歌为其 AI 服务 Gemini 进行了一系列更新，用户可直接选择 Imagen 模型生成图像，并启用了 llms.txt 文件，方便 AI Agent 获取最新的 API 和 SDK 使用方法。具体来说，用户现在可以在 Gemini 界面中直接看到并选择 Imagen 模型进行图像

开源 AI 客户端 Cherry Studio v1.3.3 正式发布

2025-05-17

771）: 为 Claude 打通了网络搜索能力，确实又快又准。 Gemini 安全设置调整： Gemini 安全设置默认调整为关闭（OFF），并升级了 @google/genai 依赖包（#5763）。 MiniApps 生态扩展：核心交互与功能增强： Cherry St

谷歌 Gemini 2.5 Pro 新增“深度思考”模式，Gemini 2.5 Flash 模型全面上线

2025-05-22

谷歌在 Google I/O 2025 大会上宣布为其旗舰AI模型Gemini 2.5 Pro引入名为“深度思考”（Deep Think）的增强推理模式。该模式允许模型在回应前考虑多个假设和答案，从而提升其在复杂查询，特别是数学和编码相关任务上的表现。根据

GoLand 2022.3 Beta 发布

2022-11-08

释 Go 1.19 增加了对文档注释中的链接、列表和新标题的支持。现在 GoLand 也支持这些新功能。集成的 Go Playground 在 GoLand 中集成了 Go Playground 功能。你可以选择一段代码，选择在选项中打开，然后点击 Playground。这将打开一个

谷歌发布 Gemini 2.5 Pro 新预览版，性能指标大幅提升

2025-06-07

谷歌于6月5日推出其迄今为止最智能的模型——Gemini 2.5 Pro的升级预览版。该版本是基于5月份的版本进行了重要升级，并计划在未来几周内作为正式稳定版（GA）向所有用户提供，为企业级规模的应用做好准备。谷歌CEO Sundar Pich

谷歌 CEO 皮查伊：超 30% 的代码由 AI 生成

2025-04-26

施和生成性 AI 解决方案的强劲需求。谷歌最近推出的 Gemini2.5Pro 模型备受开发者和消费者的欢迎。皮查伊称该模型在广泛的基准测试中表现 “首屈一指”，并在聊天机器人领域首次推出时就以显著优势获得第一。他补充说，Gem

SQL审核 | SQLE 2.2305.0 来啦！

2023-06-03

开源社区的 SQLE 是一款面向数据库使用者和管理者，支持多场景审核，支持标准化上线流程，原生支持 MySQL 审核且数据库类型可扩展的 SQL 审核工具。 SQLE 获取类型地址版本库 https://github.com/actiontech/sqle

熱門推薦