为什么 Headless 模式会干扰 Puppeteer 的功能?
Puppeteer 是一种流行的网页抓取工具,已知在运行时会遇到问题无头模式。发生这种情况的原因是积极打击抓取的网站检测到无头模式。
无头检测的原因
采用反抓取措施的网站可以实施技术来识别无头浏览器。这些技术可能涉及检查用户代理、窗口几何形状以及类人浏览和无头自动化之间不同的其他因素。
可能的解决方法
1。 Puppeteer-Extra
该库提供了可以帮助绕过无头检测的插件,包括:
2 。运行真正的 Chromium 实例
您可以将 Puppeteer 连接到现有的浏览器 UI,而不是使用 Puppeteer 启动无头 Chromium 实例。为此:
其他注意事项
以上是为什么无头模式会导致 Puppeteer 出现问题?的详细内容。更多信息请关注PHP中文网其他相关文章!