Google:互联网 60% 是重复内容


前几天在新加坡举行的 GoogleSearch Central Live 活动上,Google Webmaster 趋势分析师 Gary Illyes 称,互联网上六成的内容是重复的。

互联网上有大量重复内容是众所周知的事实,问题是比例有多大,作为最大最流行的搜索引擎,Google 给出了它的答案。

当然,大家更想知道 Google 如何定义“重复内容”。是 100% 完全相同的重复?还是标题不同但实际内容一致的重复,比如社交网络中的转载,或者进行搜索引擎优化之后的重复等。根据 Google 搜索中心文档的解释,重复内容一般是指在域内或跨域的实质性内容块,这些内容与使用同一种语言的其他内容完全匹配,或有一定体量的内容明显相似。

后面参加了此次会议的观众补充了 Gary Illyes 提出此说法时的上下文,主要是在解释 Google 如何处理“重复数据”,Google 在这里对“重复内容”的定义是基于抓取数据的考虑。

1.删除协议重复的内容 — 有利于 HTTPS
2.删除 www/non-www
3.删除包含无用参数的 URL (例如 sessionID?)
4.删除斜线/无斜线的变体
5.删除其他的校验和重复


相關推薦

2022-03-11

的区域所售卖的入门级 Android 手机。众所周知,国内各大互联网企业对 Android 系统新特性的适配速度相对缓慢,针对这个重要特性他们会积极适配吗?

2023-06-18

全漏洞。由于持续的安全问题,该用于异步 I/O 的接口在 Google 产品中受到限制或被完全禁用。 Google 安全博客指出,Google 漏洞奖励计划中 60% 的提交都与 IO_uring 有关。而且 Google 已经为 IO_uring 漏洞奖励支付了约 100 万美元。因

2023-10-11

全球 iOS 和 Android 应用程序的下载量达到 1560 万次,其中 Google Play 的下载量为 900 万,App Store 的下载量为 660 万。以及总收入接近 460 万美元,净收入 320 万美元;其中 300 万美元 自 iPhone 用户,其余来自 Google Play。 ChatGPT 官方应

2022-10-13

立站需要自动翻译? 根据W3Techs的统计,截至2020年3月。互联网上使用英语的人数占比为25.3%,使用中文的人数占比为19.4%(如下图) 值得注意的是,世界上除了英语和汉语之外,有多达55.3%的用户,使用其他语言浏览网站 但

2023-07-13

前后端分离的微服务架构解决方案。 面向企业级应用和互联网应用设计开发,既兼顾传统项目的微服务化,又满足互联网应用开发建设、快速迭代的使用需求。 平台架构使用微服务领域及周边相关的各类新兴技术或主流技术

2022-04-25

,Android 的版本更新和安全修复存在严重的碎片化现象,Google 和芯片厂商无法直接推送这些更新内容,Android 手机的更新通常是交由各个厂商自己负责,一般情况下也只有 Google 自己的 Pixel 和三星等大厂近几年的产品才能获得更

2022-09-10

GitHub Copilot 可帮助他们一直处于“心流”状态 (73%),并在重复性任务期间保持脑力劳动 (87%)。这就是开发者的幸福所在,因为从之前的研究中知道上下文切换和中断会毁掉开发者的一天,并且某些类型的工作正在耗尽精力。

2023-07-04

,API 消费者更加注重成本。 高管们尤其可能注重定价,60% 的高管将其视为与 API 集成之前需要考虑的一个因素。 API 投资前景光明 92% 的受访者表示,未来 12 个月内对 API 投资将增加或保持不变,高于去年的 89%。这一增

2024-09-25

3.8倍。 人工智能加速迭代 今年是我国全功能接入国际互联网30周年。“经过30年发展,我国已经拥有10.9亿网民,形成全球最大的数字消费市场。2023年,我国网络零售额达15.42万亿元,连续11年居世界首位;移动支付规模相比20

2024-02-02

企业级用户采用,广泛落地于政务、金融、电信、物流、互联网等领域的核心业务系统。 墨天轮是中国知名数据库技术社区,其发起的中国数据库流行度排行榜,依据搜索引擎数据、核心案例数、资质数量、专利数、论文数等

2022-09-15

Google Fonts 是一个由 1451 个开源字体系列(截止 2022 年 9 月)和 API 组成的库,这包括免费和开源的字体系列、用于浏览字体库的交互式 Web 目录,以及通过 CSS 和 Android 使用字体的 API。Google Fonts 最早于 2010 年推出,随后还进行了

2022-04-01

F37 的 Fedora IoT Device Onboarding 计划的更多详细信息。 「Google Open Source Peer Bonus」是由 Google 推行的开源奖励计划,旨在奖励由 Google 员工所提名的外部开源贡献者,表彰这些外部开源贡献者对开源所做出的特殊贡献。 近日,Google

2023-09-12

程师 Timo Tijhof 发表文章《An Internet of PHP》,探讨了 PHP 在互联网中的广泛应用和重要性。 下面是文章整理的部分数据。 PHP 仍然是首选编程语言 根据 W3 Techs 对全球前 1000 万个网站使用的编程语言分析(截至 2023.8):

2023-06-15

系起来,实现互联互动并没有那么容易。 早在 2022 年,Google 就曾宣布将会为 Google Home 智能家居产品推出脚本编辑器,如今这个功能终于上线了,借助这个工具智能家居可以实现更加丰富的功能。 Google Home 的自动化脚本编辑