Rumah >Java >javaTutorial >Bagaimana untuk Mengekstrak Data dengan Cekap dari Tag DIV HTML dengan Nama Kelas Tertentu dalam Java?

Bagaimana untuk Mengekstrak Data dengan Cekap dari Tag DIV HTML dengan Nama Kelas Tertentu dalam Java?

Susan Sarandon
Susan Sarandonasal
2024-10-24 17:03:02402semak imbas

How to Efficiently Extract Data from HTML DIV Tags with a Specific Class Name in Java?

Penghuraian HTML Java

Apabila bekerja dengan aplikasi mengikis web, adalah perlu untuk mengekstrak data secara berkesan daripada halaman HTML. Dalam senario ini, tugasnya adalah untuk mendapatkan data daripada tag DIV tertentu dengan nama kelas CSS yang diberikan. Walaupun pendekatan semasa mencari nama kelas dalam setiap baris HTML berfungsi, ia mungkin tidak optimum.

Jsoup sebagai Alternatif

Pertimbangkan untuk menggunakan Jsoup perpustakaan untuk pemprosesan HTML. Jsoup direka bentuk untuk mengendalikan HTML yang cacat dan menyediakan sintaks yang mudah untuk menghuraikan HTML dalam Java menggunakan pemilih teg seperti jQuery.

Menggunakan Jsoup

Untuk menggunakan Jsoup, ikuti ini langkah:

  1. Import perpustakaan Jsoup ke dalam projek anda.
  2. Buat objek dokumen Jsoup daripada kod sumber HTML.
  3. Gunakan kaedah pilih untuk mencari DIV teg dengan nama kelas CSS yang ditentukan.
  4. Akses data yang diekstrak menggunakan kaedah seperti text() untuk mendapatkan kandungan teks atau attr("href") untuk mendapatkan semula URL pautan.

Contohnya:

<code class="java">import org.jsoup.Jsoup;
import org.jsoup.nodes.Document;
import org.jsoup.select.Elements;

Document doc = Jsoup.parse(html);
Elements divs = doc.select("div.classname");

for (Element div : divs) {
    if (div.hasClass("classname")) {
        System.out.println("Text: " + div.text());
        System.out.println("Link: " + div.attr("href"));
    }
}</code>

Atas ialah kandungan terperinci Bagaimana untuk Mengekstrak Data dengan Cekap dari Tag DIV HTML dengan Nama Kelas Tertentu dalam Java?. Untuk maklumat lanjut, sila ikut artikel berkaitan lain di laman web China PHP!

Kenyataan:
Kandungan artikel ini disumbangkan secara sukarela oleh netizen, dan hak cipta adalah milik pengarang asal. Laman web ini tidak memikul tanggungjawab undang-undang yang sepadan. Jika anda menemui sebarang kandungan yang disyaki plagiarisme atau pelanggaran, sila hubungi admin@php.cn