从搜索结果中消失的页面。浪费预算。排名下降,用户体验不达标。重复内容造成的问题对SEO营销人员来说是一个大问题。

虽然建议是简单的 - 不要在网页中重用文本 - 避免重复内容的现实是一个更复杂。

什么是重复的内容?

根据谷歌网站管理员的定义重复内容通常是指在域内或跨域的实质性内容块,这些内容要么完全匹配其他内容,要么明显相似。大多数情况下,这并不是欺骗性的。”

最容易发现重复内容的地方是页面上;然而,重复的标题和元描述也算作重复的内容,可以更难搜索营销人员发现和修复没有一个重复内容检查

之间的25和30%前谷歌工程师马特·卡茨说,网络内容的大部分都属于复制类。很容易看出这是如何发生的:通用的产品描述、样板文本或品牌消息经常在域和页面之间重复,没有恶意的意图。搜索引擎知道重复的内容会发生;这就是为什么,尽管有相反的声明,重复的内容不会招致谷歌的惩罚。

会招致谷歌惩罚的是复制内容。当垃圾邮件发送者从原始来源抓取内容并将其放到自己的网站上时,就会出现复制内容。和复制内容一样,复制内容会导致两个网页中包含相同的内容块;然而,与复制内容不同的是,复制内容是有意为之的,不能为读者增加价值,而且经常涉及一个劣质网站。

搜索引擎严重查看被抓取的内容,可能会对抓取网站进行惩罚。最好让爬虫知道您的站点内容不是从其他来源搜集的。我们将在下面讨论。

SEO的重复内容吗?

如果重复的内容不会导致谷歌惩罚,你能高兴地让它在你的网站上乱跑吗?不。重复的内容仍然会对你的页面排名产生负面影响有机交通,没有任何实际惩罚击中你的网站。

首先,搜索引擎避免在结果页面上返回重复条目。这对搜索者有意义;毕竟,一个结果页面包含10个在不同页面上的10个相同结果的结果与具有10种变化,原始结果的页面的有用不太有用。

搜索引擎必须决定哪个版本的重复内容是最相关的。为了做到这一点,他们考虑领域权威和哪个页面看起来是原始的,最权威的内容来源。爬虫然后从结果页过滤出重复:

  • 如果你展示的内容也出现在一个更权威的网站上,你的URL将被过滤出结果页面,有利于更高权威的网站。
  • 如果您网站的几页具有重​​复的内容,则将从搜索引擎结果页面(SERPS)中过滤出大部分页面。总体现场能见度将受到影响。

第二,重复的内容页面会稀释链接的公平性和页面的权威性。如果您的网站拥有两个不同的url,但内容相同,那么链接到您的内容的网站必须在这两个版本中进行选择。这会将入站链接传播得比必要的更薄,对问题页面的排名信号产生负面影响。

如何查找重复内容问题

重复的内容通常肉眼可见,但有时它隐藏在网站的代码中。这就是为什么最好使用软件来检查重复内容

现场重复内容

Alexa的SEO审计工具包含一个重复内容检查器,它可以找到具有相同内容的不同url,并建议如何修复它们。该工具还提醒您一般重复内容SEO提示,如您可以在此提示框中看到的:

Alexa的SEO审计工具提醒你重复内容SEO提示

Site Audit工具识别跨元描述和标题的重复内容,产生一个可导出的url列表,使发现和修复问题更容易:

结果是产生的URL列表

修复这些技术错误将有助于您改进Meta-Tag SEO,从搜索引擎结果页面(SERPS)导致较高的点击率。

非现场重复内容

在不同网站上存在的异地重复的内容 - 相同的内容 - 可能更加困难到位。

为了确保你没有发布已经在其他网站上存在的内容,在发布之前尝试使用剽窃工具来确保你的博客内容没有被剽窃。如果你的合作对象是外包写手或新团队成员,他们可能不知道原创内容的重要性,那么这一点尤为重要。

您还可以使用抄袭工具查看其他网站是否未复制内容。Copyscape等付费工具扫描Web以查找从您网站复制的内容的实例。这种类型的非现场重复内容更难修复,尽管您可以尝试联系网站的经理并要求他们修复它。如果这不起作用,请阅读另一种处理复制内容的方式。

8常见重复内容问题及解决方法

复制内容并没有一种万能的解决方案。但有一些共同的解决方案可以帮助解决最常见的问题及其后果:

1:打印友好版本的页面

即使在无限制的移动数据和语音助手的时代,打印机友好的网页也很好。但是,虽然它们对需要访问纸质文档的人来说,但它们可以生成重复的内容问题。打印机友好的URL创建同一页面的两个不同版本;如果两个版本是可索引的,爬虫将花费你的爬行预算爬行两者,并将不得不选择哪一个显示在serp。

解决方案:使用规范的标签将防止打印机友好和移动页面版本成为重复的内容问题。的canonical标签设置页面的主要版本,并将所有排名信号发送到该主要版本。

要设置一个rel=规范的URL,将一段代码放在你想要定位为规范的页面的部分,用你网站上的原始内容的URL替换该URL。

< link rel = "规范化" href = " originalcontenturl.com " >

2: http/https或子域问题

改变从http到https.应该对您的网站排名产生积极影响,因为谷歌将HTTPS视为积极的排名因素。但是,转换有时会导致重复的内容问题,因为爬虫看到您网站的两个相同的版本。

将站点从HTTP更改为HTTPS

同样的事情也会出现在有或没有www的同一网站的版本中。前缀。机器人不得不在网站的不同版本中进行选择,这消耗了爬虫预算和不必要的链接分配。

解决方案:在你的站点的搜索控制台中设置一个首选域名可以让爬虫知道他们应该关注你的域名的哪个版本。要设置首选域,请转到搜索控制台中的站点设置,并在首选域部分中选择您想要的选项。

注意:现在此选项仅适用于旧版搜索控制台

3:UTM参数和会话ID

使用参数来跟踪信息和会话id是一个很好的主意,以准确的web营销指标.但是搜索引擎将每个版本解释为带有重复内容的不同URL。再一次,多个版本将混淆爬虫和稀释排名因素。

解决方案:rel=canonical标记允许您设置URL的首选版本。它保证了正确的URL被机器人抓取,并收到所有的SEO好处带来的反向链接和网站访问。

注意:只有在每个页面上的内容相同,只能使用rel = canonical标记。

4:分页

搜索引擎可能无法识别分页页面,并将其解释为重复的内容。有不同类型的分页问题会导致重复的内容——例如,图库分页,当图库中的每个项目都有自己的页面时;还有类别分页,当产品列表跨越几个页面时。无论问题的技术细节如何,它们都可能导致重复内容问题。

搜索引擎错误的分页页面用于重复内容

解决方案:分页问题通常通过使用来解决rel = "上一页"rel =“下一个”标签。这些告诉抓取分页系列的组件URL之间的确切关系。

2019年3月谷歌宣布他们决定退出这些标签,建议用户喜欢单页内容,但参与者内容仍然可以包括rel =“prev”,并且rel =“next”标记。

5:同一页的国家/语言版本

网站通常有特定国家的域名,每个域名上都有相同的内容,例如,www.yousite.com.www.yoursite.com.au,分别为美国和澳大利亚服务。这些网站上几乎所有内容都可能复制,但网站管理员仍然需要确保两者都出现在SERPS中。

解决方案:有两个选项可以帮助保证每个域的可见性:顶级域名还有hreflang标签。

  • 顶级域名出现在域名的末尾,包括常见的形式,如。com、。org、。edu、。net、。gov、以及国家一级的域。谷歌建议使用这些顶级结构来发送内容服务于不同地域的明确信号。这意味着http://www.example.de.从搜索引擎的角度理解比http://de.example.com,这不是顶层格式。
  • hreflang标签帮助机器人向用户显示他们所在位置的网站的正确版本。例如,在你的网站的部分添加以下代码,将向西班牙用户显示你的西班牙语版本的域名:

<链接rel =交替" href =http://example.com“hreflang =en-es " / >

由于hreflang,爬虫不会将一个网站的翻译版本识别为重复内容。

6:复制内容

垃圾邮件窃取您的内容是生命的现实。不幸的是,这种活动可以对原始网站产生负面影响。这就是为什么你需要采取措施,以防止复制的内容并保护您的网站的权威。

解决方案:首先,试着联系违规网站,要求他们删除内容。如果他们没有,你可以在这里了解更多如何举报侵犯版权。

7:联合内容

与高级合作伙伴网站分享你的内容是一种很好的方式来驱动推荐流量和获得有价值的反向链接。但是如果您采用这条路线,您需要确保爬虫程序理解这不是重复的内容。如果不这样做,可能会导致您共享的站点出现在serp中,并且您自己的站点也会被过滤掉,即使您制作了内容。

解决方案:在您同意让博客中的内容中的博客中,请让他们包含一个rel = canonical标签在每个URL的元素中显示你的内容。这是有效的一部分搜索引擎优化内容规划

8:样板内容

样板内容是跨域重复的文本,但不是恶意的。例如,当供应商在销售产品时提供标准文本时,你会经常看到电子商务域名上的样板内容。零售商为了节省时间而重复使用这些文本;缺点是,爬行器知道这是一个重复的内容问题。

电子商务零售商应尽可能重写产品说明。这需要很多汗水权益,但它避免了重复的内容和改进电子商务搜索引擎优化.如果您的博客或其他SEO内容上有样板内容,请确保包含样板内容的页面也有足够的额外内容,以区分用户和搜索引擎。

防止重复内容的最佳做法

通过以下预防措施,阻止网站窃取你的内容,减轻重复内容对网站排名的影响:

  • 停止垃圾刮刀网站采取信用为您的内容使用a自引导rel =典型典礼在你的网站页面上。原始页面部分中的这段代码将自己指向页面的规范引用。如果有任何网站复制URL的内容,搜索引擎可以识别你的页面作为真相的最终来源。
  • 链接到规范版本您的网站的网址。例如,如果您有一个同时具有移动版本和桌面版本的页面,选择哪个是规范的,然后将所有内部链接指向该页面。如果您构建到该URL的外部链接,请确保所有链接都指向规范链接。这将向爬虫程序发送明确的信号,告知您希望在serp中显示哪个链接。
  • 用一个301重定向在适当的情况下,通过将类似的页面巩固到一个强大的页面,可以最小化重复内容。您可以随着时间的推移构建了几个类似的着陆页面,所有这些都包含类似的信息,并试图为相同的关键字进行排名。301重定向将阻止这些页面竞争,并将更强的排名信号发送到首选页面。

最好的做法是保护您的站点不受重复内容的影响。然而,重复内容的问题仍然可能出现。

结论

在关键字研究、内容战略和营销计划上投入血汗资本后,你不希望因为可避免的重复内容问题而输给竞争对手。监视和修复这些问题应该是持续的SEO卫生的一部分。

注册免费试用Alexa的高级计划要获得经常性SEO审核,以及竞争性分析和关键词研究工具