So beheben Sie 403 Forbidden Errors für Java Web Scraping
Beim Scraping von Google-Suchergebnissen mit Java kann es sein, dass Sie auf die Fehlermeldung „403 Forbidden“ stoßen. Fehler, während Webbrowser die erwarteten Ergebnisse zurückgeben. Dies liegt daran, dass Websites wie Google Anti-Scraping-Maßnahmen implementieren, um automatisierten Zugriff ohne einen geeigneten Benutzeragenten zu verhindern.
Um dieses Problem zu lösen, müssen Sie Ihr Java-Programm so ändern, dass es einen Benutzeragenten-Header enthält, der einen simuliert Browseranfrage. So geht's:
- Notwendige Bibliotheken importieren:
import java.net.HttpURLConnection; import java.net.URL; import java.io.BufferedReader; import java.io.InputStreamReader;
- Verbindung herstellen:
URLConnection connection = new URL("https://www.google.com/search?q=" + query).openConnection();
- Legen Sie den Benutzeragenten fest Header:
connection.setRequestProperty("User-Agent", "Mozilla/5.0 (Windows NT 6.1; WOW64) AppleWebKit/537.11 (KHTML, like Gecko) Chrome/23.0.1271.95 Safari/537.11");
- Verbinden und Daten abrufen:
connection.connect(); BufferedReader r = new BufferedReader(new InputStreamReader(connection.getInputStream(), Charset.forName("UTF-8")));
Diese Änderung stellt sicher, dass Ihr Java-Programm als legitimer Browser angezeigt wird, sodass Sie um den 403 Forbidden-Fehler zu umgehen. Beachten Sie jedoch, dass Google seine Anti-Scraping-Maßnahmen ständig aktualisiert. Daher müssen Sie möglicherweise Ihren Code anpassen, wenn in Zukunft unvorhergesehene Fehler auftreten.
Das obige ist der detaillierte Inhalt vonWarum erhalte ich beim Web Scraping mit Java den Fehler 403 Forbidden?. Für weitere Informationen folgen Sie bitte anderen verwandten Artikeln auf der PHP chinesischen Website!

Heiße KI -Werkzeuge

Undresser.AI Undress
KI-gestützte App zum Erstellen realistischer Aktfotos

AI Clothes Remover
Online-KI-Tool zum Entfernen von Kleidung aus Fotos.

Undress AI Tool
Ausziehbilder kostenlos

Clothoff.io
KI-Kleiderentferner

AI Hentai Generator
Erstellen Sie kostenlos Ai Hentai.

Heißer Artikel

Heiße Werkzeuge

SublimeText3 chinesische Version
Chinesische Version, sehr einfach zu bedienen

MinGW – Minimalistisches GNU für Windows
Dieses Projekt wird derzeit auf osdn.net/projects/mingw migriert. Sie können uns dort weiterhin folgen. MinGW: Eine native Windows-Portierung der GNU Compiler Collection (GCC), frei verteilbare Importbibliotheken und Header-Dateien zum Erstellen nativer Windows-Anwendungen, einschließlich Erweiterungen der MSVC-Laufzeit zur Unterstützung der C99-Funktionalität. Die gesamte MinGW-Software kann auf 64-Bit-Windows-Plattformen ausgeführt werden.

Dreamweaver CS6
Visuelle Webentwicklungstools

mPDF
mPDF ist eine PHP-Bibliothek, die PDF-Dateien aus UTF-8-codiertem HTML generieren kann. Der ursprüngliche Autor, Ian Back, hat mPDF geschrieben, um PDF-Dateien „on the fly“ von seiner Website auszugeben und verschiedene Sprachen zu verarbeiten. Es ist langsamer und erzeugt bei der Verwendung von Unicode-Schriftarten größere Dateien als Originalskripte wie HTML2FPDF, unterstützt aber CSS-Stile usw. und verfügt über viele Verbesserungen. Unterstützt fast alle Sprachen, einschließlich RTL (Arabisch und Hebräisch) und CJK (Chinesisch, Japanisch und Koreanisch). Unterstützt verschachtelte Elemente auf Blockebene (wie P, DIV),

Senden Sie Studio 13.0.1
Leistungsstarke integrierte PHP-Entwicklungsumgebung