ホームページ >Java >&#&チュートリアル >ログイン後の Web サイトスクレイピングのために Jsoup で投稿リクエストと Cookie を処理するにはどうすればよいですか?

ログイン後の Web サイトスクレイピングのために Jsoup で投稿リクエストと Cookie を処理するにはどうすればよいですか?

Barbara Streisand
Barbara Streisandオリジナル
2024-10-29 04:01:29476ブラウズ

How to Handle Post Requests and Cookies in Jsoup for Website Scraping After Login?

jsoup での投稿リクエストと Cookie の処理

ログイン後に Web サイトをスクレイピングしようとすると、次のものが不足しているために問題が発生するのが一般的です。クッキー。認証されたセッションを維持するために、Web サイトは通常、ログイン中に Cookie を設定します。

jsoup では、ログイン リクエストが成功した後、Connection.Response オブジェクトを使用して、後続のリクエストに使用されるセッション Cookie を取得できます。

<code class="java">Connection.Response res = Jsoup.connect("http://www.example.com/login.php")
    .data("username", "myUsername", "password", "myPassword")
    .method(Method.POST)
    .execute();</code>

応答を取得したら、セッション Cookie にアクセスできます。セッション Cookie には通常、「SESSIONID」のような名前が付いています。

<code class="java">String sessionId = res.cookie("SESSIONID");</code>

以降のページ リクエストは、セッション Cookie を使用して作成する必要があります。 session:

<code class="java">Document doc2 = Jsoup.connect("http://www.example.com/otherPage")
    .cookie("SESSIONID", sessionId)
    .get();</code>

Cookie 処理を jsoup コードに組み込むことで、ログイン後に Web サイトの後続のページに正常に移動してスクレイピングできます。

以上がログイン後の Web サイトスクレイピングのために Jsoup で投稿リクエストと Cookie を処理するにはどうすればよいですか?の詳細内容です。詳細については、PHP 中国語 Web サイトの他の関連記事を参照してください。

声明:
この記事の内容はネチズンが自主的に寄稿したものであり、著作権は原著者に帰属します。このサイトは、それに相当する法的責任を負いません。盗作または侵害の疑いのあるコンテンツを見つけた場合は、admin@php.cn までご連絡ください。