Heim >Backend-Entwicklung >Python-Tutorial >Umgehen der Bot-Erkennungssoftware mit Selenium in Python

Umgehen der Bot-Erkennungssoftware mit Selenium in Python

Mary-Kate Olsen
Mary-Kate OlsenOriginal
2024-11-04 18:06:02410Durchsuche

Bypassing Bot Detection Software with Selenium in Python

(Nutzung auf eigene Gefahr, ich dulde nichts Illegales)

Websites wie Amazon verwenden Bot-Erkennungssoftware wie Imperva und FingerprintJS, um die Interaktion automatisierter Tools mit ihrer Website zu blockieren. Und das zu Recht, um Web-Scraper und Hacker davon abzuhalten, ihre wertvollen Daten zu stehlen.

Wenn sie es nur wüssten...

Diese Sicherheitskontrollen lassen sich ziemlich leicht umgehen, wenn Sie wissen, was Sie tun.

Es gibt mehrere Möglichkeiten, diese Sicherheitskontrollen zu umgehen:

  • Proxys rotieren
  • Verwendung von Cookies
  • Benutzeragenten und HTTP-Header rotieren
  • Remote-Javascript-Signaturen in Ihrem Webtreiber (wir werden uns das bald ansehen! ?)
  • Vermeidung von Mustern bei der Interaktion mit Websites

Wenn Sie Selenium verwenden und durch Automatisierungssoftware blockiert werden.

Es gibt einen kleinen Trick, den wir implementieren können, der uns den Aufwand ersparen kann, rotierende Proxys, Header oder Benutzeragenten einzurichten.

Deaktivieren Sie das Selenium-Automatisierungsflag

Aber hier ist eine andere einfachere Möglichkeit, die den Zweck erfüllen könnte – die Deaktivierung des Automatisierungsflags von Selenium.

Selenium hat standardmäßig Automatisierungsflags aktiviert, die Sie möglicherweise daran hindern, mit Anti-Bot-Software auf Websites zuzugreifen.

Um den Block zu umgehen, müssen Sie diese Automatisierungsflags in Ihrem Selenium-Code deaktivieren. Sehen wir uns an, wie wir das mit einem einfachen Einzeiler machen können.

Zuerst rufen wir die Funktion webdriver.Chromeoptions() auf und instanziieren sie in einer Variablen namens „Optionen“.

Dadurch können wir benutzerdefinierte Optionen zu unserem Webtreiber hinzufügen:

options = webdriver.ChromeOptions

Jetzt fügen wir die Option zum Deaktivieren des Automatisierungsflags hinzu, indem wir die folgende Zeile zu unserem Selenium-Code hinzufügen:

options.add_argument("--disable-blink-features=AutomationControlled")

Dieser einfache Einzeiler deaktiviert das Automatisierungsflag und teilt der Website mit, dass Sie kein Bot sind.

Das obige ist der detaillierte Inhalt vonUmgehen der Bot-Erkennungssoftware mit Selenium in Python. Für weitere Informationen folgen Sie bitte anderen verwandten Artikeln auf der PHP chinesischen Website!

Stellungnahme:
Der Inhalt dieses Artikels wird freiwillig von Internetnutzern beigesteuert und das Urheberrecht liegt beim ursprünglichen Autor. Diese Website übernimmt keine entsprechende rechtliche Verantwortung. Wenn Sie Inhalte finden, bei denen der Verdacht eines Plagiats oder einer Rechtsverletzung besteht, wenden Sie sich bitte an admin@php.cn