首頁  >  文章  >  Java  >  如何使用Jsoup將網頁資料提取到Java程式中?

如何使用Jsoup將網頁資料提取到Java程式中?

Linda Hamilton
Linda Hamilton原創
2024-10-30 21:47:30938瀏覽

How to Extract Web Page Data into Java Programs with Jsoup?

Java 程式的網頁資料擷取

將網頁中的資訊擷取到Java 程式中需要一種稱為Web 抓取的特定技術。 Web 抓取涉及解析 HTML 內容以識別和提取目標資料。

強烈建議的一種方法是利用 Jsoup HTML 解析器,該解析器以其類似 jQuery 的 CSS 選擇器支援和增強的循環相容性而聞名。以下是示範網頁抓取過程的範例 Java 程式碼:

<code class="java">import org.jsoup.Jsoup;
import org.jsoup.nodes.Document;
import org.jsoup.nodes.Element;
import org.jsoup.select.Elements;

public class WebScraper {

    public static void main(String[] args) throws Exception {
        // Target URL
        String url = "https://www.bestbuy.com/site/best-buy-insignia-55-class-f30-series-led-4k-uhd-smart-fire-tv/6494164.p?skuId=6494164";

        // Connect to the URL and parse HTML content
        Document document = Jsoup.connect(url).get();

        // Get product information using CSS selectors
        String title = document.select("h1.page-title").text();
        String price = document.select(".priceView-customer-price").text();
        String description = document.select(".product-lang-en-us .product-description-rich-html").text();

        // Print results</code>

以上是如何使用Jsoup將網頁資料提取到Java程式中?的詳細內容。更多資訊請關注PHP中文網其他相關文章!

陳述:
本文內容由網友自願投稿,版權歸原作者所有。本站不承擔相應的法律責任。如發現涉嫌抄襲或侵權的內容,請聯絡admin@php.cn