(違法行為を容認するわけではありませんので、自己責任でご使用ください)
Amazon などの Web サイトは、Imperva や FingerprintJS などのボット検出ソフトウェアを使用して、自動ツールが Web サイトと対話するのをブロックします。そして、ウェブスクレーパーやハッカーが貴重なデータを盗むのを防ぐために、彼らは当然のことを行っています。
彼らが知っていれば...
これらのセキュリティ制御は、自分が何をしているのかを知っていれば、非常に簡単に回避できます。
これらのセキュリティ制御を回避できる方法はいくつかあります:
Selenium を使用していて、自動化ソフトウェアによってブロックされている場合。
ローテーションプロキシ、ヘッダー、またはユーザーエージェントを設定する手間を省くために実装できるちょっとしたトリックがあります。
しかし、これを解決できるかもしれないもう 1 つの簡単な方法は、Selenium の自動化フラグを無効にすることです。
Selenium ではデフォルトで自動化フラグが有効になっており、ボット対策ソフトウェアを使用した Web サイトへのアクセスがブロックされる可能性があります。
ブロックをバイパスするには、Selenium コードで自動化フラグを無効にする必要があります。簡単なワンライナーを使用してそれを行う方法を見てみましょう。
まず、webdriver.Chromeoptions() 関数を呼び出して、options という変数にインスタンス化します。
これにより、Web ドライバーにカスタム オプションを追加できるようになります:
オプション = webdriver.ChromeOptions
次に、Selenium コードに次の行を追加して、自動化フラグを無効にするオプションを追加しましょう。
options.add_argument("--disable-blink-features=AutomationControlled")
この簡単なワンライナーは自動化フラグを無効にし、あなたがボットではないことを Web サイトに伝えます。
以上がPython の Selenium を使用したボット検出ソフトウェアのバイパスの詳細内容です。詳細については、PHP 中国語 Web サイトの他の関連記事を参照してください。