為什麼我的 Java 程式在抓取 Google 搜尋結果時會出現 403 禁止錯誤，而我的瀏覽器卻不會？-java教程-PHP中文網

首頁

Java

java教程

為什麼我的 Java 程式在抓取 Google 搜尋結果時會出現 403 禁止錯誤，而我的瀏覽器卻不會？

DDD

Dec 11, 2024 pm 07:33 PM

Why Does My Java Program Get a 403 Forbidden Error When Scraping Google Search Results While My Browser Doesn't?

Web 瀏覽器成功時Java 程序收到403 禁止錯誤

問題：

一個Java旨在檢索給定Google 搜尋查詢的結果計數的程式返回403 Forbidden錯誤，而相同的查詢在 Web 瀏覽器中會產生結果。程式碼片段：

import java.io.BufferedReader;
import java.io.IOException;
import java.io.InputStreamReader;
import java.net.URL;

public class DataGetter {

    public static void main(String[] args) throws IOException {
        getResultAmount("test");
    }

    private static int getResultAmount(String query) throws IOException {
        BufferedReader r = new BufferedReader(new InputStreamReader(new URL("https://www.google.com/search?q=" + query).openConnection()
                .getInputStream()));
        String line;
        String src = "";
        while ((line = r.readLine()) != null) {
            src += line;
        }
        System.out.println(src);
        return 1;
    }

}

錯誤：

Exception in thread "main" java.io.IOException: Server returned HTTP response code: 403 for URL: https://www.google.com/search?q=test
    at sun.net.www.protocol.http.HttpURLConnection.getInputStream(Unknown Source)
    at sun.net.www.protocol.https.HttpsURLConnectionImpl.getInputStream(Unknown Source)
    at DataGetter.getResultAmount(DataGetter.java:15)
    at DataGetter.main(DataGetter.java:10)

解決方案：

出現此問題是因為Java的URLConnection 類別預設不會偽造實際的用戶代理程式。修改程式碼以設定使用者代理程式標頭可以解決此問題：

URLConnection connection = new URL("https://www.google.com/search?q=" + query).openConnection();
connection.setRequestProperty("User-Agent", "Mozilla/5.0 (Windows NT 6.1; WOW64) AppleWebKit/537.11 (KHTML, like Gecko) Chrome/23.0.1271.95 Safari/537.11");
connection.connect();

BufferedReader r = new BufferedReader(new InputStreamReader(connection.getInputStream(), Charset.forName("UTF-8")));

此外，SSL 處理是透明的，如異常堆疊追蹤所示。

其他注意事項：

檢索結果計數涉及進一步的步驟，包括透過取得cookie 來偽造瀏覽器解析重定向令牌連結：

String cookie = connection.getHeaderField("Set-Cookie").split(";")[0];
Pattern pattern = Pattern.compile("content=\\"0;url=(.*?)\\"");
Matcher m = pattern.matcher(response);
if (m.find()) {
    String url = m.group(1);
    connection = new URL(url).openConnection();
    connection.setRequestProperty("User-Agent", "Mozilla/5.0 (Windows NT 6.1; WOW64) AppleWebKit/537.11 (KHTML, like Gecko) Chrome/23.0.1271.95 Safari/537.11");
    connection.setRequestProperty("Cookie", cookie);
    connection.connect();
    r = new BufferedReader(new InputStreamReader(connection.getInputStream(), Charset.forName("UTF-8")));
    sb = new StringBuilder();
    while ((line = r.readLine()) != null) {
        sb.append(line);
    }
    response = sb.toString();
    pattern = Pattern.compile("<div><p>執行此完整程式碼會產生2930000000L 的結果。 </p></div>

以上是為什麼我的 Java 程式在抓取 Google 搜尋結果時會出現 403 禁止錯誤，而我的瀏覽器卻不會？的詳細內容。更多資訊請關注PHP中文網其他相關文章！

陳述

本文內容由網友自願投稿，版權歸原作者所有。本站不承擔相應的法律責任。如發現涉嫌抄襲或侵權的內容，請聯絡admin@php.cn

JVM性能與其他語言May 14, 2025 am 12:16 AM

JVM'SperformanceIsCompetitiveWithOtherRuntimes，operingabalanceOfspeed，安全性和生產性。 1）JVMUSESJITCOMPILATIONFORDYNAMICOPTIMIZAIZATIONS.2）c提供NativePernativePerformanceButlanceButlactsjvm'ssafetyFeatures.3）

Java平台獨立性：使用示例May 14, 2025 am 12:14 AM

JavaachievesPlatFormIndependencEthroughTheJavavIrtualMachine（JVM），允許CodeTorunonAnyPlatFormWithAjvm.1）codeisscompiledIntobytecode，notmachine-specificodificcode.2）bytecodeisisteredbytheybytheybytheybythejvm，enablingcross-platerssectectectectectross-eenablingcrossectectectectectection.2）

JVM架構：深入研究Java虛擬機May 14, 2025 am 12:12 AM

TheJVMisanabstractcomputingmachinecrucialforrunningJavaprogramsduetoitsplatform-independentarchitecture.Itincludes:1)ClassLoaderforloadingclasses,2)RuntimeDataAreafordatastorage,3)ExecutionEnginewithInterpreter,JITCompiler,andGarbageCollectorforbytec

JVM：JVM與操作系統有關嗎？May 14, 2025 am 12:11 AM

JVMhasacloserelationshipwiththeOSasittranslatesJavabytecodeintomachine-specificinstructions,managesmemory,andhandlesgarbagecollection.ThisrelationshipallowsJavatorunonvariousOSenvironments,butitalsopresentschallengeslikedifferentJVMbehaviorsandOS-spe

Java：寫一次，在任何地方跑步（WORA） - 深入了解平台獨立性May 14, 2025 am 12:05 AM

Java實現“一次編寫，到處運行”通過編譯成字節碼並在Java虛擬機（JVM）上運行。 1）編寫Java代碼並編譯成字節碼。 2）字節碼在任何安裝了JVM的平台上運行。 3）使用Java原生接口（JNI）處理平台特定功能。儘管存在挑戰，如JVM一致性和平台特定庫的使用，但WORA大大提高了開發效率和部署靈活性。

Java平台獨立性：與不同的操作系統的兼容性May 13, 2025 am 12:11 AM

JavaachievesPlatFormIndependencethroughTheJavavIrtualMachine（JVM），允許Codetorunondifferentoperatingsystemsswithoutmodification.thejvmcompilesjavacodeintoplatform-interploplatform-interpectentbybyteentbytybyteentbybytecode，whatittheninternterninterpretsandectectececutesoneonthepecificos，atrafficteyos，Afferctinginginginginginginginginginginginginginginginginginginginginginginginginginginginginginginginginginginginginginginginginginginging

什麼功能使Java仍然強大May 13, 2025 am 12:05 AM

JavaispoperfulduetoitsplatFormitiondence，對象與偏見，RichstandardLibrary，PerformanceCapabilities和StrongsecurityFeatures.1）Platform-dimplighandependectionceallowsenceallowsenceallowsenceallowsencationSapplicationStornanyDevicesupportingJava.2）

頂級Java功能：開發人員的綜合指南May 13, 2025 am 12:04 AM

Java的頂級功能包括：1)面向對象編程，支持多態性，提升代碼的靈活性和可維護性；2)異常處理機制，通過try-catch-finally塊提高代碼的魯棒性；3)垃圾回收，簡化內存管理；4)泛型，增強類型安全性；5)ambda表達式和函數式編程，使代碼更簡潔和表達性強；6)豐富的標準庫，提供優化過的數據結構和算法。

See all articles