(使用风险自负,我不会纵容任何非法行为)
Amazon 等网站使用 Imperva 和 FingerprintJS 等机器人检测软件来阻止自动化工具与其网站交互。他们这样做是正确的,以防止网络爬虫和黑客窃取他们的宝贵数据。
如果他们知道...
如果您知道自己在做什么,那么很容易绕过这些安全控制。
我们可以通过几种方法绕过这些安全控制:
如果您正在使用 Selenium 并且您被自动化软件阻止。
我们可以实现一个小技巧,可以省去设置旋转代理、标头或用户代理的麻烦。
但是这里有另一种更简单的方法可以解决这个问题 - 禁用 Selenium 的自动化标志。
Selenium 默认启用自动化标志,这可能会阻止您使用反机器人软件访问网站。
要绕过该块,您必须在 Selenium 代码中禁用这些自动化标志,让我们看看如何使用简单的一个衬垫来做到这一点。
首先,我们调用 webdriver.Chromeoptions() 函数并将其实例化为一个名为 options 的变量。
这使我们能够向网络驱动程序添加自定义选项:
选项= webdriver.ChromeOptions
现在,让我们通过将以下行添加到我们的 Selenium 代码中来添加禁用自动化标志的选项:
options.add_argument("--disable-blink-features=AutomationControlled")
这个简单的一行代码会禁用自动化标志,并告诉网站您不是机器人。
以上是使用 Python 中的 Selenium 绕过机器人检测软件的详细内容。更多信息请关注PHP中文网其他相关文章!