Java 程式的網頁資料擷取
將網頁中的資訊擷取到Java 程式中需要一種稱為Web 抓取的特定技術。 Web 抓取涉及解析 HTML 內容以識別和提取目標資料。
強烈建議的一種方法是利用 Jsoup HTML 解析器,該解析器以其類似 jQuery 的 CSS 選擇器支援和增強的循環相容性而聞名。以下是示範網頁抓取過程的範例 Java 程式碼:
<code class="java">import org.jsoup.Jsoup; import org.jsoup.nodes.Document; import org.jsoup.nodes.Element; import org.jsoup.select.Elements; public class WebScraper { public static void main(String[] args) throws Exception { // Target URL String url = "https://www.bestbuy.com/site/best-buy-insignia-55-class-f30-series-led-4k-uhd-smart-fire-tv/6494164.p?skuId=6494164"; // Connect to the URL and parse HTML content Document document = Jsoup.connect(url).get(); // Get product information using CSS selectors String title = document.select("h1.page-title").text(); String price = document.select(".priceView-customer-price").text(); String description = document.select(".product-lang-en-us .product-description-rich-html").text(); // Print results</code>
以上是如何使用Jsoup將網頁資料提取到Java程式中?的詳細內容。更多資訊請關注PHP中文網其他相關文章!