suchen
HeimJavajavaLernprogrammWarum erhalte ich beim Web Scraping mit Java den Fehler 403 Forbidden?

Why Am I Getting a 403 Forbidden Error When Web Scraping with Java?

So beheben Sie 403 Forbidden Errors für Java Web Scraping

Beim Scraping von Google-Suchergebnissen mit Java kann es sein, dass Sie auf die Fehlermeldung „403 Forbidden“ stoßen. Fehler, während Webbrowser die erwarteten Ergebnisse zurückgeben. Dies liegt daran, dass Websites wie Google Anti-Scraping-Maßnahmen implementieren, um automatisierten Zugriff ohne einen geeigneten Benutzeragenten zu verhindern.

Um dieses Problem zu lösen, müssen Sie Ihr Java-Programm so ändern, dass es einen Benutzeragenten-Header enthält, der einen simuliert Browseranfrage. So geht's:

  1. Notwendige Bibliotheken importieren:
import java.net.HttpURLConnection;
import java.net.URL;
import java.io.BufferedReader;
import java.io.InputStreamReader;
  1. Verbindung herstellen:
URLConnection connection = new URL("https://www.google.com/search?q=" + query).openConnection();
  1. Legen Sie den Benutzeragenten fest Header:
connection.setRequestProperty("User-Agent", "Mozilla/5.0 (Windows NT 6.1; WOW64) AppleWebKit/537.11 (KHTML, like Gecko) Chrome/23.0.1271.95 Safari/537.11");
  1. Verbinden und Daten abrufen:
connection.connect();
BufferedReader r = new BufferedReader(new InputStreamReader(connection.getInputStream(), Charset.forName("UTF-8")));

Diese Änderung stellt sicher, dass Ihr Java-Programm als legitimer Browser angezeigt wird, sodass Sie um den 403 Forbidden-Fehler zu umgehen. Beachten Sie jedoch, dass Google seine Anti-Scraping-Maßnahmen ständig aktualisiert. Daher müssen Sie möglicherweise Ihren Code anpassen, wenn in Zukunft unvorhergesehene Fehler auftreten.

Das obige ist der detaillierte Inhalt vonWarum erhalte ich beim Web Scraping mit Java den Fehler 403 Forbidden?. Für weitere Informationen folgen Sie bitte anderen verwandten Artikeln auf der PHP chinesischen Website!

Stellungnahme
Der Inhalt dieses Artikels wird freiwillig von Internetnutzern beigesteuert und das Urheberrecht liegt beim ursprünglichen Autor. Diese Website übernimmt keine entsprechende rechtliche Verantwortung. Wenn Sie Inhalte finden, bei denen der Verdacht eines Plagiats oder einer Rechtsverletzung besteht, wenden Sie sich bitte an admin@php.cn

Heiße KI -Werkzeuge

Undresser.AI Undress

Undresser.AI Undress

KI-gestützte App zum Erstellen realistischer Aktfotos

AI Clothes Remover

AI Clothes Remover

Online-KI-Tool zum Entfernen von Kleidung aus Fotos.

Undress AI Tool

Undress AI Tool

Ausziehbilder kostenlos

Clothoff.io

Clothoff.io

KI-Kleiderentferner

AI Hentai Generator

AI Hentai Generator

Erstellen Sie kostenlos Ai Hentai.

Heiße Werkzeuge

SublimeText3 chinesische Version

SublimeText3 chinesische Version

Chinesische Version, sehr einfach zu bedienen

MinGW – Minimalistisches GNU für Windows

MinGW – Minimalistisches GNU für Windows

Dieses Projekt wird derzeit auf osdn.net/projects/mingw migriert. Sie können uns dort weiterhin folgen. MinGW: Eine native Windows-Portierung der GNU Compiler Collection (GCC), frei verteilbare Importbibliotheken und Header-Dateien zum Erstellen nativer Windows-Anwendungen, einschließlich Erweiterungen der MSVC-Laufzeit zur Unterstützung der C99-Funktionalität. Die gesamte MinGW-Software kann auf 64-Bit-Windows-Plattformen ausgeführt werden.

Dreamweaver CS6

Dreamweaver CS6

Visuelle Webentwicklungstools

mPDF

mPDF

mPDF ist eine PHP-Bibliothek, die PDF-Dateien aus UTF-8-codiertem HTML generieren kann. Der ursprüngliche Autor, Ian Back, hat mPDF geschrieben, um PDF-Dateien „on the fly“ von seiner Website auszugeben und verschiedene Sprachen zu verarbeiten. Es ist langsamer und erzeugt bei der Verwendung von Unicode-Schriftarten größere Dateien als Originalskripte wie HTML2FPDF, unterstützt aber CSS-Stile usw. und verfügt über viele Verbesserungen. Unterstützt fast alle Sprachen, einschließlich RTL (Arabisch und Hebräisch) und CJK (Chinesisch, Japanisch und Koreanisch). Unterstützt verschachtelte Elemente auf Blockebene (wie P, DIV),

Senden Sie Studio 13.0.1

Senden Sie Studio 13.0.1

Leistungsstarke integrierte PHP-Entwicklungsumgebung