ホームページ  >  記事  >  Java  >  Jsoup を使用した Web サイト スクレイピングのセッション Cookie を維持するにはどうすればよいですか?

Jsoup を使用した Web サイト スクレイピングのセッション Cookie を維持するにはどうすればよいですか?

Linda Hamilton
Linda Hamiltonオリジナル
2024-10-29 00:50:30784ブラウズ

How Can I Maintain Session Cookies for Website Scraping with Jsoup?

セッション Cookie を維持するための jsoup の使用

jsoup を使用して Web サイトへの認証を行う場合、複数のページ リクエストにわたってセッション Cookie を維持することが重要です。このアプローチを組み込むことにより、後続のページ リクエストを適切な承認で行うことができます。

ログイン成功後にセッション Cookie を取得するには、次のコード スニペットを利用します。

<code class="java">Connection.Response res = Jsoup.connect("http://www.example.com/login.php")
    .data("username", "myUsername", "password", "myPassword")
    .method(Method.POST)
    .execute();

Document doc = res.parse();
String sessionId = res.cookie("SESSIONID"); // verify the correct cookie name</code>

セッションが完了するとCookie が取得されると、後続のページ リクエストにはそれを含める必要があります:

<code class="java">Document doc2 = Jsoup.connect("http://www.example.com/otherPage")
    .cookie("SESSIONID", sessionId)
    .get();</code>

これらの手順に従うことで、Apache httpclient などの外部ライブラリに頼ることなく、jsoup を効果的に使用して、認証された Web ページから情報を収集できます。

以上がJsoup を使用した Web サイト スクレイピングのセッション Cookie を維持するにはどうすればよいですか?の詳細内容です。詳細については、PHP 中国語 Web サイトの他の関連記事を参照してください。

声明:
この記事の内容はネチズンが自主的に寄稿したものであり、著作権は原著者に帰属します。このサイトは、それに相当する法的責任を負いません。盗作または侵害の疑いのあるコンテンツを見つけた場合は、admin@php.cn までご連絡ください。