Rumah >Java >javaTutorial >Bagaimana Mengendalikan Permintaan Pos dan Kuki dalam Jsoup untuk Mengikis Laman Web Selepas Log Masuk?

Bagaimana Mengendalikan Permintaan Pos dan Kuki dalam Jsoup untuk Mengikis Laman Web Selepas Log Masuk?

Barbara Streisand
Barbara Streisandasal
2024-10-29 04:01:29476semak imbas

How to Handle Post Requests and Cookies in Jsoup for Website Scraping After Login?

Mengendalikan Permintaan Siaran dan Kuki dalam jsoup

Apabila cuba mengikis tapak web selepas log masuk, adalah perkara biasa untuk menghadapi masalah kerana kekurangan biskut. Untuk mengekalkan sesi yang disahkan, tapak web biasanya menetapkan kuki semasa log masuk.

Dalam jsoup, anda boleh mendapatkan semula kuki sesi yang digunakan untuk permintaan seterusnya dengan menggunakan objek Connection.Response selepas membuat permintaan log masuk yang berjaya:

<code class="java">Connection.Response res = Jsoup.connect("http://www.example.com/login.php")
    .data("username", "myUsername", "password", "myPassword")
    .method(Method.POST)
    .execute();</code>

Sebaik sahaja anda mendapat respons, anda boleh mengakses kuki sesi, yang biasanya mempunyai nama seperti "SESSIONID":

<code class="java">String sessionId = res.cookie("SESSIONID");</code>

Permintaan halaman seterusnya mesti dibuat dengan kuki sesi untuk mengekalkan sesi:

<code class="java">Document doc2 = Jsoup.connect("http://www.example.com/otherPage")
    .cookie("SESSIONID", sessionId)
    .get();</code>

Dengan memasukkan pengendalian kuki ke dalam kod jsoup anda, anda boleh berjaya menavigasi dan mengikis halaman seterusnya tapak web selepas log masuk.

Atas ialah kandungan terperinci Bagaimana Mengendalikan Permintaan Pos dan Kuki dalam Jsoup untuk Mengikis Laman Web Selepas Log Masuk?. Untuk maklumat lanjut, sila ikut artikel berkaitan lain di laman web China PHP!

Kenyataan:
Kandungan artikel ini disumbangkan secara sukarela oleh netizen, dan hak cipta adalah milik pengarang asal. Laman web ini tidak memikul tanggungjawab undang-undang yang sepadan. Jika anda menemui sebarang kandungan yang disyaki plagiarisme atau pelanggaran, sila hubungi admin@php.cn