ホームページ  >  記事  >  Java  >  Jsoup を使用して Web ページ データを Java プログラムに抽出する方法

Jsoup を使用して Web ページ データを Java プログラムに抽出する方法

Linda Hamilton
Linda Hamiltonオリジナル
2024-10-30 21:47:30938ブラウズ

How to Extract Web Page Data into Java Programs with Jsoup?

Java プログラムの Web ページ データ抽出

Web ページから Java プログラムに情報を抽出するには、Web スクレイピングと呼ばれる特定の技術が必要です。 Web スクレイピングには、HTML コンテンツを解析して対象のデータを識別して抽出することが含まれます。

強く推奨されるアプローチの 1 つは、jQuery のような CSS セレクターのサポートで知られ、ループ互換性が強化された Jsoup HTML パーサーを利用することです。 Web スクレイピング プロセスを示すサンプル Java コードを次に示します:

<code class="java">import org.jsoup.Jsoup;
import org.jsoup.nodes.Document;
import org.jsoup.nodes.Element;
import org.jsoup.select.Elements;

public class WebScraper {

    public static void main(String[] args) throws Exception {
        // Target URL
        String url = "https://www.bestbuy.com/site/best-buy-insignia-55-class-f30-series-led-4k-uhd-smart-fire-tv/6494164.p?skuId=6494164";

        // Connect to the URL and parse HTML content
        Document document = Jsoup.connect(url).get();

        // Get product information using CSS selectors
        String title = document.select("h1.page-title").text();
        String price = document.select(".priceView-customer-price").text();
        String description = document.select(".product-lang-en-us .product-description-rich-html").text();

        // Print results</code>

以上がJsoup を使用して Web ページ データを Java プログラムに抽出する方法の詳細内容です。詳細については、PHP 中国語 Web サイトの他の関連記事を参照してください。

声明:
この記事の内容はネチズンが自主的に寄稿したものであり、著作権は原著者に帰属します。このサイトは、それに相当する法的責任を負いません。盗作または侵害の疑いのあるコンテンツを見つけた場合は、admin@php.cn までご連絡ください。