Cloudflare 推出「AI迷宫」应对 AI 爬虫


与其阻止爬虫机器人,不如主动把它们引进一个由AI生成的「废话迷宫」,让它们自我迷失

Cloudflare近日推出名为「AI迷宫」(AI Labyrinth)的新工具,用以对付未经授权、到处抓取网页数据的爬虫机器人。这些爬虫通常抓取免费内容,以训练AI模型。

Cloudflare介绍称,当系统识别到异常爬虫行为时,「AI迷宫」就会启动,将这些机器人引向由AI自动生成的虚假页面。这些页面毫无实际价值,仅用于消耗机器人的时间与资源,令其陷入困惑,最终无法获取有效数据

过去,网站管理员常用「robots.txt」文件引导机器人避开特定页面。但一些AI公司,例如Anthropic、Perplexity AI等,屡次被指控忽视这种协议,擅自抓取数据,导致网站与机器人之间形成技术上的持续对抗。

Cloudflare表示,每日大约有500亿次爬虫访问请求。尽管已开发多种拦截工具,但爬虫总能迅速适应并绕过防御措施。这次Cloudflare转变策略,不再直接拦截,而是通过生成迷宫般的虚假页面,让机器人陷入无用信息的循环,主动消耗自身的资源。

这种方法也被称作“下一代蜜罐陷阱”(Honeypot)。人类用户可以轻松识别并避免点击这些无价值链接,而机器人则毫无辨别能力,会持续抓取陷阱页面,越陷越深。Cloudflare由此可记录并分析机器人行为,快速识别新的爬虫模式,并不断优化防御措施。

据介绍,AI迷宫利用Workers AI和开源模型生成各种主题的独特HTML页面。Cloudflare并非按需生成内容,而是预先生成并筛选内容,确保其不存在XSS漏洞,并将其存储在R2中以加快检索速度。每个生成的页面都包含适当的元指令,以防止搜索引擎索引,从而保护合法的SEO工作。

这些Nofollow标签确保不遵守推荐指南的AI爬虫将被困在迷宫中,而遵守规则的爬虫则会安全地忽略蜜罐。重要的是,这些链接通过精心实现的属性和样式对普通访客不可见。除了保护网站内容外,AI迷宫还作为一种复杂的识别机制。当这些隐藏链接被点击时,Cloudflare可以自信地识别出自动化爬虫活动,并将这些宝贵的数据输入机器学习模型,以增强爬虫检测能力。这形成了一个有益的反馈循环,每次爬取尝试都有助于保护所有Cloudflare客户。

Cloudflare强调,为防止误导公众,这些生成的虚假内容虽基于真实科学事实,但与目标网站毫无关系,因此对爬虫训练AI模型毫无价值。

管理员只需在Cloudflare后台“机器人管理”界面启用该工具,即可简单使用。未来,Cloudflare还计划构建更加复杂庞大的虚假页面网络,使恶意爬虫彻底迷失其中,进一步加大爬虫成本与困难度。


相關推薦

2025-04-04

一些科技公司也在尽自己的努力解决这个问题——例如,Cloudflare 最近推出了 AI Labyrinth,它使用人工智能生成的内容来减慢爬虫的速度。 然而,这更像是一场猫捉老鼠的游戏,最终可能迫使许多出版商躲在登录和付费墙的后面

2023-10-26

游戏、内容等领域广泛应用。🤖📱💼AI应用阿里国际站推出AI生意助手阿里巴巴国际站推出了全新的AI工具——生意助手Smart Assistant,旨在通过AI技术提高外贸商家的运营效率、提升转化率和寻找商机。【AiBase提要:】🤖 阿里巴

2023-02-08

伊 (Sundar Pichai) 今天宣布,他们将在未来几周内面向公众推出由 LaMDA 提供支持的实验性对话式 AI 服务,称为 Bard —— 与当前流行的 ChatGPT 展开直接竞争。在公开发布之前,目前 Bard 仅开放给受信任的测试人员。 Bard 由谷

2023-08-16

迷宫中。 目前,Maya OS 正处于评估阶段,预计很快就会推出。首先是计划于 8 月 15 日之前在印度南区所有连接互联网的计算机上安装 Maya OS,同时安装 Chakravyuh 保护系统。预计在今年年底覆盖印度国防部所有的计算机系统。

2025-03-25

球互联网基础设施领域上演了一场罕见的“CEO大战”——Cloudflare CEO Matthew Prince与Vercel CEO Guillermo Rauch在社交媒体X上展开激烈交锋,双方围绕技术漏洞修复、服务稳定性与行业道德展开唇枪舌战。 这场冲突不仅暴露了技术巨头

2025-04-04

由百度前高管景鲲创立的美国公司Genspark今日宣布推出其全新产品"Genspark Super Agent",号称是一款"快速、准确、可控"的通用AI代理。这一消息迅速在技术社区引发热议,众多专业人士将其与Manus相提并论,认为这标志着通用AI代理

2024-08-27

不过是表象和作用不一样罢了。 如今各个国产厂商都推出了自己的 AI 大模型,并且各类评测指标纷纷以大模型的通用能力好、参数量大、精确度高来衡量模型的表面能力,但若寻求大模型的本质,实际都是源自同根。如果用

2023-11-10

月,苹果公司构建了自己的大型语言模型,称为 Ajax,并推出了一个名为 “Apple GPT” 的内部聊天机器人来测试其功能。下一步的关键是确定该技术是否能够应对竞争对手,以及苹果如何将其实际应用到产品中。 分别负责人工

2024-10-09

第一天 快活的我们 快不活了 …… 锵锵锵锵~ UOS AI 推出两大重磅功能 “UOS AI 随航 ” & “UOS AI 写作 ” 帮你快速找回工作状态,效率UP UP 以下是详细介绍   UOS AI 随航:打工搭子,随时待命 01 操作简单秒上手

2023-10-24

月,苹果公司构建了自己的大型语言模型,称为 Ajax,并推出了一个名为 “Apple GPT”的内部聊天机器人来测试其功能。下一步的关键是确定该技术是否能够应对竞争对手,以及苹果如何将其实际应用到产品中。 分别负责人

2024-05-14

甲骨文宣布将推出其 AI 编程工具 Oracle Code Assist: Oracle 计划推出人工智能 (AI) 代码伙伴 Oracle Code Assist,以帮助开发人员提高速度并加强代码一致性。 Oracle Code Assist 由在 Oracle 云基础设施远程软件服务(Oracle Cloud Infrastructure

2023-09-07

者采用了一种巧妙地交织手法,选择将吉祥物图像封装在迷宫内。“为壁纸创造了一个大胆的中心概念--古老、古典而又现代、充满活力” 感兴趣的用户可以从 Google Drive 进行壁纸下载(最高 4K 分辨率,各种尺寸和变体)。

2024-07-31

将促进 AI 技术的创新和获取,同时使美国政府能够快速应对未来模式可能出现的风险。 他们呼吁美国政府制定一项持续性计划,收集有关开放模型的风险和好处的资料进行评估,并根据评估结果采取行动,包括在必要时对模型

2023-06-28

Gemini 并不是 DeepMind 首次涉足语言模型,该公司在去年曾推出了一个名为 Sparrow 的聊天机器人。Hassabis 一月份透露称,他们考虑将在今年某个时候发布 Sparrow 的私人测试版;但目前上不清楚这些计划是否仍在按计划进行。 除了