首頁 >web前端 >js教程 >網站如何偵測 Selenium 自動化,以及如何規避?

網站如何偵測 Selenium 自動化,以及如何規避?

Linda Hamilton
Linda Hamilton原創
2024-12-17 22:38:19943瀏覽

How Do Websites Detect Selenium Automation, and How Can It Be Circumvented?

網站的Selenium 偵測

雖然Selenium 與Chromedriver 提供瀏覽器自動化,但某些網站具有偵測何時使用selenium 實例的能力,儘管沒有明確的自動化。這種能力提出了這些網站如何完成這種檢測的問題。

偵測技術

網站採用各種技術來辨識 Selenium 的存在。一種流行的方法是檢查 Selenium 運行時出現的預定義 JavaScript 變數。這些變數經常包含術語“selenium”或“webdriver”,並且可以在視窗物件和文件變數(例如 $cdc_ 和 $wdc_)中檢測到。檢測機制因所使用的瀏覽器而異。

對策

要規避網站檢測,一種方法是消除或更改特定 JavaScript 變數的存在。例如,在 Chrome 中,修改 chromedriver 原始碼以將 $cdc_ 更改為不同的變數名稱已被發現是有效的。

用於機器人偵測的偽代碼

某些機器人網路可能會利用複雜的演算法來偵測 Selenium 的使用情況。以下偽程式碼讓我們一窺潛在的偵測技術:

runBotDetection = function () {

    // Check for window-specific detection keys
    for (windowDetectionKey in windowDetectionKeys) {
        if (window[windowDetectionKeyValue]) {
            return true;
        }
    }

    // Check for document-specific detection keys
    for (documentDetectionKey in documentDetectionKeys) {
        if (window['document'][documentDetectionKeyValue]) {
            return true;
        }
    }

    // Inspect document for specific patterns
    for (documentKey in window['document']) {
        if (documentKey.match(/$[a-z]dc_/) && window['document'][documentKey]['cache_']) {
            return true;
        }
    }

    // Check for additional external indicators
    if (window['external'] && window['external'].toString() && (window['external'].toString()['indexOf']('Sequentum') != -1)) return true;

    // Examine HTML element attributes
    if (window['document']['documentElement']['getAttribute']('selenium')) return true;
    if (window['document']['documentElement']['getAttribute']('webdriver')) return true;
    if (window['document']['documentElement']['getAttribute']('driver')) return true;

    return false;
};

其他方法

除了更改JavaScript 變數之外,其他逃避Selenium 偵測的技術還包括:

  • 使用VPN:VPN 可以暫時封鎖使用者的IP 位址,但在後續請求後可能會被偵測到。
  • 修改用戶代理:更改用戶代理字串可以讓網頁瀏覽器看起來像普通用戶。
  • 停用瀏覽器外掛:某些外掛程式可能會洩漏可能洩漏Selenium 的資訊
  • 修改標頭:可以操縱HTTP 標頭,使其看起來更類似於典型用戶的流量。
  • 使用代理伺服器:代理伺服器可以進一步匿名化使用者的連線。

以上是網站如何偵測 Selenium 自動化,以及如何規避?的詳細內容。更多資訊請關注PHP中文網其他相關文章!

陳述:
本文內容由網友自願投稿,版權歸原作者所有。本站不承擔相應的法律責任。如發現涉嫌抄襲或侵權的內容,請聯絡admin@php.cn