Gemini API 支持抓取 URL


谷歌宣布其Gemini API中的URL Context工具已正式支持直接抓取 URL 内容,无需额外脚本或中间步骤。

Gemini API 提供了 URL Context 功能,允许你在请求中直接嵌入网页链接,模型会自动访问并解析网页内容。支持的内容类型包括:

  • 文本网页(HTML、JSON、TXT 等)
  • PDF 文件
  • 图片(PNG、JPEG、WebP 等)

不支持的内容:YouTube 视频、Google Docs、付费墙内容等。

✅ 使用示例(Python SDK)

from google import genai
from google.genai import types

client = genai.Client()

response = client.models.generate_content(
model="gemini-2.5-flash",
contents=[
"总结这篇文章的内容:",
types.Part.from_uri(
uri="https://example.com/article",
mime_type='text/html'
)
]
)
print(response.text)

使用限制

  • 每次最多支持 20 个 URL
  • 单个 URL 内容大小上限为 34MB
  • 抓取内容会计入 输入 Tokens 费用

如果你使用 Gemini CLI,也可以通过 web_fetch 工具快速抓取网页,例如:

gemini-cli web-fetch --prompt "总结 https://example.com/article 的主要内容"

该工具会自动识别提示中的 URL 并调用 Gemini API 抓取内容。

如你正在开发基于 Gemini 的应用,URL Context 功能已足够替代传统的爬虫或 HTML 解析器,大幅提升开发效率。

 

相关链接

https://ai.google.dev/gemini-api/docs/url-context
https://colab.sandbox.google.com/github/google-gemini/cookbook/blob/main/quickstarts/Grounding.ipynb#url-context


相關推薦

2025-08-01

自己的斜杠命令,以自动化重复性工作流。   集成Gemini网页工具:集成了Gemini的网页访问能力,允许模型进行Google搜索和分析URL内容,以提供更准确、实时的信息。 图像支持与OCR:read_file工具现在支持读取和分析多种格

2023-05-06

内容包括: Improvements 在Jsoup.connect(String url)中,原生支持在路径或查询字符串中包含 Unicode 字符的 URL,而无需由调用者进行转义。#1914 在没有父节点的节点上调用Node.remove()现在是不可行的,会出现验证错误。#1898 Bug Fixes

2025-06-09

HTML电子邮件模板增强 功能升级:邮件模板视图现在支持模板参数调用,允许更灵活的自定义邮件内容 技术细节:通过PR #44896实现,文档说明请参考此处 应用场景:可直接在后台配置个性化邮件模板,提升品牌一致

2025-07-11

的多模态能力将使该模型能与 OpenAI 的 GPT-5o 和 Google 的 Gemini 2.5 Pro 展开更激烈的竞争。Grok 4 未来某个时候可能会支持视频。 语音功能: Grok 4 的语音功能(Grok 4 Voice)拥有自然、酷似真人的声音,且干扰更少。 实时网络访

2025-07-23

谷歌Gemini模型的原生文本转语音(TTS)功能已适用于规模化的生产环境,该功能目前支持Gemini 2.5 Flash和Gemini 2.5 Pro两个模型。 https://x.com/OfficialLoganK/status/1947328086577492309 据官方人员透露,这项强大的功能适用于多种用例

2025-06-08

容 DeepSeek 和其他 OpenAI 兼容接口) Azure OpenAI API Google Gemini Pro API Ollama(用于本地部署) Groq API 内置模板: 翻译(支持 40+ 种语言) 文本润色和改进 学术写作增强 内容摘要生成 语法检查 自定义选项:

2025-07-16

容 DeepSeek 和其他 OpenAI 兼容接口) Azure OpenAI API Google Gemini Pro API Ollama(用于本地部署) Groq API Agent模式: 支持多步骤分析和结果合成 可配置的分析步骤限制 内置模板: 翻译(支持 40+ 种语言) 文本润

2025-07-24

谷歌为其 AI 服务 Gemini 进行了一系列更新,用户可直接选择 Imagen 模型生成图像,并启用了 llms.txt 文件,方便 AI Agent 获取最新的 API 和 SDK 使用方法。 具体来说,用户现在可以在 Gemini 界面中直接看到并选择 Imagen 模型进行图像

2025-05-17

771): 为 Claude 打通了网络搜索能力,确实又快又准。 Gemini 安全设置调整: Gemini 安全设置默认调整为关闭 (OFF),并升级了 @google/genai 依赖包 (#5763)。 MiniApps 生态扩展: 核心交互与功能增强: Cherry St

2025-05-22

谷歌在 Google I/O 2025 大会上宣布为其旗舰AI模型Gemini 2.5 Pro引入名为“深度思考”(Deep Think)的增强推理模式。该模式允许模型在回应前考虑多个假设和答案,从而提升其在复杂查询,特别是数学和编码相关任务上的表现。 根据

2022-11-08

释 Go 1.19 增加了对文档注释中的链接、列表和新标题的支持。现在 GoLand 也支持这些新功能。 集成的 Go Playground 在 GoLand 中集成了 Go Playground 功能。 你可以选择一段代码,选择在选项中打开,然后点击 Playground。这将打开一个

2025-06-07

谷歌于6月5日推出其迄今为止最智能的模型——Gemini 2.5 Pro的升级预览版。该版本是基于5月份的版本进行了重要升级,并计划在未来几周内作为正式稳定版(GA)向所有用户提供,为企业级规模的应用做好准备。 谷歌CEO Sundar Pich

2025-04-26

施和生成性 AI 解决方案的强劲需求。 谷歌最近推出的 Gemini2.5Pro 模型备受开发者和消费者的欢迎。皮查伊称该模型在广泛的基准测试中表现 “首屈一指”,并在聊天机器人领域首次推出时就以显著优势获得第一。他补充说,Gem

2023-06-03

开源社区的 SQLE 是一款面向数据库使用者和管理者,支持多场景审核,支持标准化上线流程,原生支持 MySQL 审核且数据库类型可扩展的 SQL 审核工具。 SQLE 获取 类型 地址 版本库 https://github.com/actiontech/sqle