首頁 >Java >java教程 >為什麼我的 Java Google 搜尋程式會出現 403 禁止錯誤,但在 Web 瀏覽器中卻不會?

為什麼我的 Java Google 搜尋程式會出現 403 禁止錯誤,但在 Web 瀏覽器中卻不會?

Mary-Kate Olsen
Mary-Kate Olsen原創
2024-12-21 09:17:10120瀏覽

Why Do I Get a 403 Forbidden Error with My Java Google Search Program, But Not in My Web Browser?

403 Forbidden with Java but Not Web Browser:解決Google 搜尋問題

儘管在網路瀏覽器中成功檢索搜尋結果,但遇到到嘗試使用Java 程式取得Google 搜尋資料時出現403 Forbidden 錯誤可能會令人費解。根本原因在於 Java 請求中缺少用戶代理資訊。

要解決此問題,需要透過設定「User-Agent」標頭來模擬Web 瀏覽器的行為:

URLConnection connection = new URL("https://www.google.com/search?q=" + query).openConnection();
connection.setRequestProperty("User-Agent", "Mozilla/5.0 (Windows NT 6.1; WOW64) AppleWebKit/537.11 (KHTML, like Gecko) Chrome/23.0.1271.95 Safari/537.11");
connection.connect();

此標頭指示伺服器將請求視為源自Web瀏覽器,從而防止403 錯誤。值得注意的是,SSL 處理是自動處理的。

但是,使用 Java 檢索結果量需要進一步的步驟。需要取得cookie並解析重定向令牌連結:

String cookie = connection.getHeaderField("Set-Cookie").split(";")[0];
Pattern pattern = Pattern.compile("content=\\"0;url=(.*?)\\"");
Matcher m = pattern.matcher(response);
if (m.find()) {
    String url = m.group(1);
    connection = new URL(url).openConnection();
    connection.setRequestProperty("User-Agent", "Mozilla/5.0 (Windows NT 6.1; WOW64) AppleWebKit/537.11 (KHTML, like Gecko) Chrome/23.0.1271.95 Safari/537.11");
    connection.setRequestProperty("Cookie", cookie);
    connection.connect();
    r = new BufferedReader(new InputStreamReader(connection.getInputStream(), Charset.forName("UTF-8")));
    sb = new StringBuilder();
    while ((line = r.readLine()) != null) {
        sb.append(line);
    }
    response = sb.toString();
    pattern = Pattern.compile("<div>

執行整個程式碼區塊會得到2930000000L的結果,表示搜尋結果的數量。

以上是為什麼我的 Java Google 搜尋程式會出現 403 禁止錯誤,但在 Web 瀏覽器中卻不會?的詳細內容。更多資訊請關注PHP中文網其他相關文章!

陳述:
本文內容由網友自願投稿,版權歸原作者所有。本站不承擔相應的法律責任。如發現涉嫌抄襲或侵權的內容,請聯絡admin@php.cn