Heim >Java >javaLernprogramm >Wie gehe ich mit Post-Anfragen und Cookies in Jsoup für das Website-Scraping nach der Anmeldung um?

Wie gehe ich mit Post-Anfragen und Cookies in Jsoup für das Website-Scraping nach der Anmeldung um?

Barbara Streisand
Barbara StreisandOriginal
2024-10-29 04:01:29497Durchsuche

How to Handle Post Requests and Cookies in Jsoup for Website Scraping After Login?

Umgang mit Post-Anfragen und Cookies in jsoup

Beim Versuch, eine Website nach der Anmeldung zu scannen, kommt es häufig zu Problemen aufgrund fehlender Cookies Kekse. Um eine authentifizierte Sitzung aufrechtzuerhalten, setzen Websites normalerweise während der Anmeldung Cookies.

In jsoup können Sie das Sitzungscookie für nachfolgende Anfragen mithilfe des Connection.Response-Objekts abrufen, nachdem Sie eine erfolgreiche Anmeldeanfrage gestellt haben:

<code class="java">Connection.Response res = Jsoup.connect("http://www.example.com/login.php")
    .data("username", "myUsername", "password", "myPassword")
    .method(Method.POST)
    .execute();</code>

Sobald Sie die Antwort erhalten haben, können Sie auf das Sitzungscookie zugreifen, das normalerweise einen Namen wie „SESSIONID“ hat:

<code class="java">String sessionId = res.cookie("SESSIONID");</code>

Nachfolgende Seitenanfragen müssen mit dem Sitzungscookie durchgeführt werden, um das aufrechtzuerhalten Sitzung:

<code class="java">Document doc2 = Jsoup.connect("http://www.example.com/otherPage")
    .cookie("SESSIONID", sessionId)
    .get();</code>

Durch die Integration der Cookie-Verwaltung in Ihren JSOUP-Code können Sie nach dem Anmelden erfolgreich durch die folgenden Seiten der Website navigieren und diese durchsuchen.

Das obige ist der detaillierte Inhalt vonWie gehe ich mit Post-Anfragen und Cookies in Jsoup für das Website-Scraping nach der Anmeldung um?. Für weitere Informationen folgen Sie bitte anderen verwandten Artikeln auf der PHP chinesischen Website!

Stellungnahme:
Der Inhalt dieses Artikels wird freiwillig von Internetnutzern beigesteuert und das Urheberrecht liegt beim ursprünglichen Autor. Diese Website übernimmt keine entsprechende rechtliche Verantwortung. Wenn Sie Inhalte finden, bei denen der Verdacht eines Plagiats oder einer Rechtsverletzung besteht, wenden Sie sich bitte an admin@php.cn