首頁  >  文章  >  Java  >  如何使用 Jsoup 維護網站抓取的會話 Cookie?

如何使用 Jsoup 維護網站抓取的會話 Cookie?

Linda Hamilton
Linda Hamilton原創
2024-10-29 00:50:30862瀏覽

How Can I Maintain Session Cookies for Website Scraping with Jsoup?

使用 jsoup 維護會話 Cookie

使用 jsoup 向網站進行身份驗證時,跨多個頁面請求維護會話 Cookie 至關重要。透過採用這種方法,可以在適當的授權下發出後續頁面請求。

要在成功登入後取得會話cookie,請使用以下程式碼片段:

<code class="java">Connection.Response res = Jsoup.connect("http://www.example.com/login.php")
    .data("username", "myUsername", "password", "myPassword")
    .method(Method.POST)
    .execute();

Document doc = res.parse();
String sessionId = res.cookie("SESSIONID"); // verify the correct cookie name</code>

一旦會話取得cookie 後,後續頁面要求必須包含它:

<code class="java">Document doc2 = Jsoup.connect("http://www.example.com/otherPage")
    .cookie("SESSIONID", sessionId)
    .get();</code>

透過遵循以下步驟,jsoup 可以有效地用於從經過身份驗證的網頁中抓取和收集信息,而無需借助apache httpclient 等外部庫。

以上是如何使用 Jsoup 維護網站抓取的會話 Cookie?的詳細內容。更多資訊請關注PHP中文網其他相關文章!

陳述:
本文內容由網友自願投稿,版權歸原作者所有。本站不承擔相應的法律責任。如發現涉嫌抄襲或侵權的內容,請聯絡admin@php.cn