Penghuraian HTML Java
Apabila bekerja dengan aplikasi mengikis web, adalah perlu untuk mengekstrak data secara berkesan daripada halaman HTML. Dalam senario ini, tugasnya adalah untuk mendapatkan data daripada tag DIV tertentu dengan nama kelas CSS yang diberikan. Walaupun pendekatan semasa mencari nama kelas dalam setiap baris HTML berfungsi, ia mungkin tidak optimum.
Jsoup sebagai Alternatif
Pertimbangkan untuk menggunakan Jsoup perpustakaan untuk pemprosesan HTML. Jsoup direka bentuk untuk mengendalikan HTML yang cacat dan menyediakan sintaks yang mudah untuk menghuraikan HTML dalam Java menggunakan pemilih teg seperti jQuery.
Menggunakan Jsoup
Untuk menggunakan Jsoup, ikuti ini langkah:
Contohnya:
<code class="java">import org.jsoup.Jsoup; import org.jsoup.nodes.Document; import org.jsoup.select.Elements; Document doc = Jsoup.parse(html); Elements divs = doc.select("div.classname"); for (Element div : divs) { if (div.hasClass("classname")) { System.out.println("Text: " + div.text()); System.out.println("Link: " + div.attr("href")); } }</code>
Atas ialah kandungan terperinci Bagaimana untuk Mengekstrak Data dengan Cekap dari Tag DIV HTML dengan Nama Kelas Tertentu dalam Java?. Untuk maklumat lanjut, sila ikut artikel berkaitan lain di laman web China PHP!