使用 jsoup 维护会话 Cookie
使用 jsoup 向网站进行身份验证时,跨多个页面请求维护会话 Cookie 至关重要。通过采用这种方法,可以在适当的授权下发出后续页面请求。
要在成功登录后获取会话 cookie,请使用以下代码片段:
<code class="java">Connection.Response res = Jsoup.connect("http://www.example.com/login.php") .data("username", "myUsername", "password", "myPassword") .method(Method.POST) .execute(); Document doc = res.parse(); String sessionId = res.cookie("SESSIONID"); // verify the correct cookie name</code>
一旦会话获取 cookie 后,后续页面请求必须包含它:
<code class="java">Document doc2 = Jsoup.connect("http://www.example.com/otherPage") .cookie("SESSIONID", sessionId) .get();</code>
通过遵循以下步骤,jsoup 可以有效地用于从经过身份验证的网页中抓取和收集信息,而无需借助 apache httpclient 等外部库。
以上是如何使用 Jsoup 维护网站抓取的会话 Cookie?的详细内容。更多信息请关注PHP中文网其他相关文章!