首页  >  文章  >  Java  >  如何使用 Jsoup 维护网站抓取的会话 Cookie?

如何使用 Jsoup 维护网站抓取的会话 Cookie?

Linda Hamilton
Linda Hamilton原创
2024-10-29 00:50:30784浏览

How Can I Maintain Session Cookies for Website Scraping with Jsoup?

使用 jsoup 维护会话 Cookie

使用 jsoup 向网站进行身份验证时,跨多个页面请求维护会话 Cookie 至关重要。通过采用这种方法,可以在适当的授权下发出后续页面请求。

要在成功登录后获取会话 cookie,请使用以下代码片段:

<code class="java">Connection.Response res = Jsoup.connect("http://www.example.com/login.php")
    .data("username", "myUsername", "password", "myPassword")
    .method(Method.POST)
    .execute();

Document doc = res.parse();
String sessionId = res.cookie("SESSIONID"); // verify the correct cookie name</code>

一旦会话获取 cookie 后,后续页面请求必须包含它:

<code class="java">Document doc2 = Jsoup.connect("http://www.example.com/otherPage")
    .cookie("SESSIONID", sessionId)
    .get();</code>

通过遵循以下步骤,jsoup 可以有效地用于从经过身份验证的网页中抓取和收集信息,而无需借助 apache httpclient 等外部库。

以上是如何使用 Jsoup 维护网站抓取的会话 Cookie?的详细内容。更多信息请关注PHP中文网其他相关文章!

声明:
本文内容由网友自发贡献,版权归原作者所有,本站不承担相应法律责任。如您发现有涉嫌抄袭侵权的内容,请联系admin@php.cn