為什麼 Headless 模式會幹擾 Puppeteer 的功能?
Puppeteer 是一種流行的網頁抓取工具,已知在運行時會遇到問題無頭模式。發生這種情況的原因是積極打擊抓取的網站偵測到無頭模式。
無頭偵測的原因
採用反抓取措施的網站可以實施技術來識別無頭瀏覽器。這些技術可能涉及檢查使用者代理、視窗幾何形狀以及類人瀏覽和無頭自動化之間不同的其他因素。
可能的解決方法
1。 Puppeteer-Extra
該庫提供了可以幫助繞過無頭檢測的插件,包括:
2 。執行真正的 Chromium 實例
您可以將 Puppeteer 連接到現有的瀏覽器 UI,而不是使用 Puppeteer 啟動無頭 Chromium 實例。為此:
其他注意事項
以上是為什麼無頭模式會導致 Puppeteer 出現問題?的詳細內容。更多資訊請關注PHP中文網其他相關文章!