搜索
首页CMS教程WordPress防止 WordPress 中博客内容抓取的初学者指南

防止 WordPress 中博客内容抓取的初学者指南

Apr 20, 2025 am 07:42 AM
wordpress谷歌access搜索引擎优化为什么2025

您是否正在寻找一种方法来防止垃圾邮件发送者和诈骗者使用内容抓取工具窃取您的 WordPress 博客文章?

作为网站所有者,看到有人未经许可窃取您的内容,将其货币化,在 Google 中排名超过您,并窃取您的受众,这是非常令人沮丧的。

在本文中,我们将介绍什么是博客内容抓取、如何减少和防止内容抓取,甚至如何利用内容抓取器为自己谋取利益。

防止 WordPress 中博客内容抓取的初学者指南

什么是 WordPress 中的博客内容抓取?

博客内容抓取是指从多个来源获取内容并在另一个网站上重新发布。通常,这是通过博客的 RSS feed自动完成的。

不幸的是,您的WordPress 博客内容以这种方式被盗是非常容易且非常常见的。如果它发生在你身上,那么你就会明白它是多么的压力和令人沮丧。

有时,您的内容将被简单地复制并直接粘贴到另一个网站,包括您的格式、图像、视频等。

其他时候,您的内容将在未经您许可的情况下重新发布,并注明出处和返回您网站的链接。虽然这可以帮助您的 搜索引擎优化,但您可能只想将原始内容保留在您的网站上。

为什么内容抓取者会窃取内容?

我们的一些用户问我们为什么抓取工具会窃取内容。通常,内容盗窃的主要动机是从您的辛勤工作中获利:

  • 联盟佣金:不诚实的联盟营销人员可能会使用您的内容通过搜索引擎为他们的网站带来流量,以推广他们的利基产品。
  • 潜在客户开发:律师和房地产经纪人可能会花钱请人添加内容并在社区中获得权威,但没有意识到这些内容正在从其他来源被窃取。
  • 广告收入:博客所有者可能会抓取内容,以“为了社区的利益”在某个特定领域创建知识中心,然后在网站上贴上广告。

是否可以完全防止内容抓取?

在本文中,我们将向您展示可以采取的一些步骤来减少和防止内容抓取。但不幸的是,没有办法完全阻止顽固的小偷。

这就是为什么我们在这篇文章的最后一节介绍了如何利用内容抓取工具。虽然您无法始终阻止小偷,但您也许可以通过他们从您那里窃取的内容获得一些流量和收入。

当您发现有人抄袭您的内容时该怎么办?

由于不可能完全阻止抓取工具,因此有一天您可能会发现有人正在使用他们从您的博客中窃取的内容。您可能想知道发生这种情况时该怎么办。

以下是人们在处理内容抓取工具时采取的一些方法:

  • 什么也不做:您可能会花费大量时间与爬虫作斗争,因此一些受欢迎的博主决定什么也不做。谷歌已经将知名网站视为权威,但对于较小的网站而言并非如此。因此,我们认为这种方法并不总是最好的。
  • 删除:您可以联系抓取者并要求他们删除内容。如果他们拒绝,那么您将提交删除通知。您可以在我们的指南中了解如何轻松查找和删除 WordPress 中被盗的内容。
  • 利用优势:虽然我们积极致力于将从 WPBeginner 抓取的内容撤下,但我们也使用一些技术来获取流量并从抓取工具中赚钱。您可以在下面的“利用内容抓取器”部分了解如何操作。

话虽如此,让我们来看看如何防止 WordPress 中的博客抓取。由于这是一本综合指南,我们提供了一个目录以便于导航:

  1. 您的博客名称和徽标的版权或商标
  2. 让您的 RSS 提要更难抓取
  3. 禁用 Trackback 和 Pingback
  4. 阻止爬虫访问您的 WordPress 网站
  5. 防止 WordPress 中的图像被盗
  6. 阻止手动复制您的内容
  7. 利用内容抓取器

1. 博客名称和徽标的版权或商标

商标和版权法保护您的知识产权、品牌和业务免受许多法律挑战。这包括非法使用您的受版权保护的材料或您的品牌名称和徽标。

您应该在您的网站上清楚地显示版权声明。虽然您的内容自动受版权法保护,但显示通知会让您知道您的内容受版权保护,并且他们不能将您受保护的财产用于商业目的。

防止 WordPress 中博客内容抓取的初学者指南

例如,您可以将带有动态日期的版权声明添加到 WordPress 页脚。这将使您的版权声明保持最新。

这可能会阻止某些用户窃取它。如果您确实需要发送停止函或提交 DCMA 投诉以删除被盗内容,它也会有所帮助。

您还可以在线申请版权登记。这个过程可能很复杂,但幸运的是,有低成本的法律服务可以帮助小企业和个人。

在我们的指南中了解如何为您的博客名称和徽标注册商标和版权。

2. 让你的 RSS Feed 更难抓取

由于博客内容抓取通常是通过博客的 RSS 源自动完成的,因此让我们看一下可以对源进行的一些有用的更改。

不要在 WordPress RSS 源中包含完整的帖子内容

您可以在 RSS 源中仅包含每篇文章的摘要,而不是完整内容。这包括摘录以及帖子元数据,例如日期、作者和类别。

博客社区中肯定存在关于是否拥有完整 RSS 提要或摘要提要的争论。我们现在不会讨论这个问题,只是想说,只有摘要的优点之一是它有助于防止内容抓取。

您可以通过转到WordPress 管理面板中的设置 » 阅读来更改设置 。您需要选择“摘录”选项,然后单击“保存更改”按钮。

防止 WordPress 中博客内容抓取的初学者指南

现在,RSS 源将仅显示您文章的摘录。如果有人通过您的 RSS 源窃取您的内容,那么他​​们只会获得摘要,而不是完整的帖子。

如果您想调整摘要,那么您可以查看我们关于如何自定义 WordPress 摘录的指南。

优化您的 RSS 提要以防止抓取

您还可以通过其他方法来优化 WordPress RSS 源,以保护您的内容、获得更多反向链接、增加网络流量等等。最好的方法之一是延迟帖子出现在 RSS 提要中。

这样做的好处是,当您延迟帖子出现在 RSS 提要中时,您可以让搜索引擎有时间在您的内容出现在其他地方(例如爬虫网站)之前对您的内容进行爬网和索引。然后搜索引擎会将您的网站视为权威网站。

最安全、最简单的方法是使用WPCode  ,因为它有一个方法可以自动将正确的自定义代码添加到 WordPress 中。

防止 WordPress 中博客内容抓取的初学者指南

有关详细说明,请参阅有关如何延迟帖子出现在 WordPress RSS 源中的指南。

3. 禁用 Trackbacks、Pingbacks 和 REST API

在博客的早期, 引用引用和 pingback 是博客相互通知链接的一种方式。当有人链接到您博客上的帖子时,他们的网站会自动向您的网站发送 ping。

然后,此 pingback 将出现在您博客的 评论审核 队列中,并带有指向其网站的链接。如果您批准,他们就会从您的网站获得反向链接和提及。

这会激励垃圾邮件发送者抓取您的网站并发送引用。幸运的是,您可以禁用 trackback 和 pingback,从而减少抓取者窃取您内容的理由。

防止 WordPress 中博客内容抓取的初学者指南

有关更多信息,请查看我们关于禁用所有未来帖子的引用的指南。您可能还想了解如何禁用现有 WordPress 帖子的引用和 ping。

禁用 WordPress REST API

除了 trackback 和 pingback 之外,我们还建议禁用 WordPress REST API,因为它可以让垃圾邮件发送者更轻松地抓取您的内容。

我们有关于如何禁用 WordPress REST API 的详细指南。

您所需要做的就是安装并激活免费的 WPCode 插件,并使用其预制片段来禁用 REST API。

4.阻止爬虫访问您的 WordPress 网站

阻止抓取工具窃取您的内容的一种方法是取消他们对您网站的访问权限。您可以通过阻止其 IP 地址来手动执行此操作,但大多数用户会发现使用安全插件(例如 Web 应用程序防火墙)更容易。

使用安全插件阻止抓取工具(推荐)

手动阻止刮刀非常棘手且需要大量工作。特别是因为许多黑客尝试和攻击都是使用来自世界各地的各种随机 IP 地址进行的。要跟上所有这些随机 IP 地址几乎是不可能的。

这就是您需要Web 应用程序防火墙(WAF)(例如Wordfence 或 Securi)的原因。它们通过监控您的网站流量并在常见的安全威胁到达您的 WordPress 网站之前阻止它们,充当您的网站和所有传入流量之间的屏障。

对于 WPBeginner 网站,我们使用 Sucuri。它是一种网站安全服务,可使用网站应用程序防火墙保护您的网站免受此类攻击。

基本上,您的所有网站流量都会经过安全服务的服务器,并在其中检查是否存在可疑活动。它们会自动阻止可疑 IP 地址完全访问您的网站。了解 Sucuri 如何 帮助我们 在 3 个月内阻止 450,000 次 WordPress 攻击。

手动阻止或重定向抓取工具的 IP 地址

高级用户可能还希望手动阻止抓取工具的 IP 地址。这需要更多工作,但是一旦您了解了抓取工具的地址,您就可以专门针对它。Web 开发人员Jeff Star在撰写有关如何处理内容抓取工具的文章时建议采用这种方法。

注意: 向网站文件添加代码可能很危险。即使是一个小错误也可能会导致您的网站出现重大错误。这就是为什么我们只向高级用户推荐此方法。

您可以通过访问WordPress 托管帐户的 cPanel 仪表板中的“原始访问日志”来查找抓取工具的 IP 地址  。您需要查找请求数量异常高的 IP 地址并记录它们,例如将它们复制到单独的文本文件中。

防止 WordPress 中博客内容抓取的初学者指南

提示:您需要确保最终不会阻止您自己、合法用户或搜索引擎访问您的网站。复制看起来可疑的 IP 地址并使用在线 IP 查找工具 来了解更多信息。

一旦您确信该 IP 地址属于抓取工具,您就可以使用 cPanel“IP Blocker”工具或通过在根.htaccess文件中添加如下代码来阻止它:

防止 WordPress 中博客内容抓取的初学者指南

最好的部分是这些横幅也会出现在抓取工具的网站上。

在我们的例子中,我们总是在 RSS 源的帖子底部添加一些免责声明。通过这样做,我们可以从爬虫网站获得原始文章的反向链接。

这让谷歌和其他搜索引擎知道我们是权威。它还让他们的用户知道该网站正在窃取我们的内容。

有关更多提示,请查看我们有关 如何在 WordPress 中控制 RSS 源页脚的指南。

我们希望本教程能帮助您了解如何防止 WordPress 中的博客内容被抓取。您可能还想查看我们的终极 WordPress 安全指南或专家精选的WordPress 最佳分析解决方案。

以上是防止 WordPress 中博客内容抓取的初学者指南的详细内容。更多信息请关注PHP中文网其他相关文章!

声明
本文内容由网友自发贡献,版权归原作者所有,本站不承担相应法律责任。如您发现有涉嫌抄袭侵权的内容,请联系admin@php.cn
WordPress的插件生态系统如何增强其CMS功能?WordPress的插件生态系统如何增强其CMS功能?May 14, 2025 am 12:20 AM

WordPressPluginsscmscmscapabilities byferingCustomization和Functionality.1)超过50,000pluginsallowuserstalostailortheortheortheortheirsiteirsiteforseo,e-Commerce和security.2)pluginScaneCanextendCorefeatures,likeaddingcustostostposttypes.3 bullycanc.3)

WordPress适合电子商务吗?WordPress适合电子商务吗?May 13, 2025 am 12:05 AM

是的,WordPress非常适合做电商。 1)通过WooCommerce插件,WordPress可以快速变成功能全面的在线商店。 2)需要关注性能优化和安全性,定期更新和使用缓存、安全插件是关键。 3)WordPress提供了丰富的定制选项,提升用户体验和SEO优化效果显着。

如何在 Yandex 网站管理员工具中添加您的 WordPress 网站如何在 Yandex 网站管理员工具中添加您的 WordPress 网站May 12, 2025 pm 09:06 PM

您想将您的网站连接到Yandex网站管理员工具吗?Google搜索控制台、Bing和Yandex等网站管理员工具可帮助您优化网站、监控流量、管理robots.txt、检查网站错误等。在本文中,我们将分享如何在Yandex网站管理员工具中添加您的WordPress网站来监控您的搜索引擎流量。什么是Yandex?Yandex是一个位于俄罗斯的流行搜索引擎,类似于Google和Bing。您可以在Yandex中优

如何修复 WordPress 中的 HTTP 图片上传错误(简单)如何修复 WordPress 中的 HTTP 图片上传错误(简单)May 12, 2025 pm 09:03 PM

您需要修复WordPress中的HTTP图片上传错误吗?当您在WordPress中创建内容时,此错误可能会特别令人沮丧。当您使用内置WordPress媒体库将图像或其他文件上传到CMS时,通常会发生这种情况。在本文中,我们将向您展示如何轻松修复WordPress中的HTTP图片上传错误。WordPress媒体上传过程中出现HTTP错误的原因是什么?当您尝试使用WordPress媒体上传器将文件上传到Wo

如何修复添加媒体按钮在 WordPress 中不起作用的问题如何修复添加媒体按钮在 WordPress 中不起作用的问题May 12, 2025 pm 09:00 PM

最近,我们的一位读者报告说,他们的WordPress网站上的“添加媒体”按钮突然停止工作。此经典编辑器问题不会显示任何错误或警告,这使用户不知道为什么他们的“添加媒体”按钮不起作用。在本文中,我们将向您展示如何轻松修复WordPress中的“添加媒体”按钮不起作用的问题。是什么导致WordPress“添加媒体”按钮停止工作?如果您仍在使用旧的经典WordPress编辑器,那么“添加媒体”按钮允许您将图像、视频等插入博客文章中。

如何设置、获取和删除 WordPress Cookie(像专业人士一样)如何设置、获取和删除 WordPress Cookie(像专业人士一样)May 12, 2025 pm 08:57 PM

您想了解如何在WordPress网站上使用cookie吗?Cookie是在用户浏览器中存储临时信息的有用工具。您可以使用此信息通过个性化和行为定位来增强用户体验。在本终极指南中,我们将向您展示如何像专业人士一样设置、获取和删除WordPresscookie。注意:这是一个高级教程。它要求您精通HTML、CSS、WordPress网站和PHP。什么是Cookie?Cookie是用户访问网站时创建并存储在用户浏览

如何修复 WordPress 429 请求过多错误如何修复 WordPress 429 请求过多错误May 12, 2025 pm 08:54 PM

您是否在WordPress网站上看到“429请求过多”错误?此错误消息意味着用户向您网站的服务器发送了太多HTTP请求。此错误可能会非常令人沮丧,因为很难找出导致该错误的原因。在本文中,我们将向您展示如何轻松修复“WordPress429TooManyRequests”错误。是什么原因导致WordPress429请求过多错误?“429TooManyRequests”错误的最常见原因是用户、机器人或脚本尝试向网站

WordPress作为大型网站的CMS有多可扩展?WordPress作为大型网站的CMS有多可扩展?May 12, 2025 am 12:08 AM

WordPressCanHandLeLArgeWebsitesWithCareFulplanningAndOptimization.1)USECACHINGTOREDUCESERVERVERLOAD.2)优化YourdataBaseRegularly.3)actizeyourdatabaseregularly.3)ackdntododistibutecontent.4))

See all articles

热AI工具

Undresser.AI Undress

Undresser.AI Undress

人工智能驱动的应用程序,用于创建逼真的裸体照片

AI Clothes Remover

AI Clothes Remover

用于从照片中去除衣服的在线人工智能工具。

Undress AI Tool

Undress AI Tool

免费脱衣服图片

Clothoff.io

Clothoff.io

AI脱衣机

Video Face Swap

Video Face Swap

使用我们完全免费的人工智能换脸工具轻松在任何视频中换脸!

热门文章

热工具

MinGW - 适用于 Windows 的极简 GNU

MinGW - 适用于 Windows 的极简 GNU

这个项目正在迁移到osdn.net/projects/mingw的过程中,你可以继续在那里关注我们。MinGW:GNU编译器集合(GCC)的本地Windows移植版本,可自由分发的导入库和用于构建本地Windows应用程序的头文件;包括对MSVC运行时的扩展,以支持C99功能。MinGW的所有软件都可以在64位Windows平台上运行。

安全考试浏览器

安全考试浏览器

Safe Exam Browser是一个安全的浏览器环境,用于安全地进行在线考试。该软件将任何计算机变成一个安全的工作站。它控制对任何实用工具的访问,并防止学生使用未经授权的资源。

DVWA

DVWA

Damn Vulnerable Web App (DVWA) 是一个PHP/MySQL的Web应用程序,非常容易受到攻击。它的主要目标是成为安全专业人员在合法环境中测试自己的技能和工具的辅助工具,帮助Web开发人员更好地理解保护Web应用程序的过程,并帮助教师/学生在课堂环境中教授/学习Web应用程序安全。DVWA的目标是通过简单直接的界面练习一些最常见的Web漏洞,难度各不相同。请注意,该软件中

Dreamweaver Mac版

Dreamweaver Mac版

视觉化网页开发工具

EditPlus 中文破解版

EditPlus 中文破解版

体积小,语法高亮,不支持代码提示功能