JSoup 和JavaScript 產生的內容
使用JSoup 解析網頁時,重要的是要記住JSoup 是一個HTML 解析器,而不是一個HTML 解析器。瀏覽器引擎。這意味著它不執行 JavaScript,並且在初始頁面加載後動態添加到頁面的任何內容對於 JSoup 都是不可見的。
例如,如果您需要解析一個動態新增標籤的頁面div 元素使用 JavaScript,JSoup 將無法擷取該內容。元素本身可能存在於 HTML 原始碼中,但 JavaScript 新增的標籤將無法用於 JSoup。
存取 JavaScript 產生的內容
存取如果要透過 JavaScript 新增至頁面的內容,則需要使用可以模擬瀏覽器環境的工具。有幾個Java 函式庫可以做到這一點,例如如:
- [Selenium](https://www.selenium.dev/)
- [HtmlUnit](https: //htmlunit.sourcefor ge.io/)
- [JBrowserDriver](https://github.com/JBrowserDriver/JBrowserDriver)
這些庫可讓您建立虛擬瀏覽器實例並與網頁交互,
這些庫可讓您建立虛擬瀏覽器實例並與網頁交互,就像在真實瀏覽器中呈現一樣。這使您能夠執行 JavaScript、觸發事件並存取動態添加的內容。
使用Selenium 的範例import org.openqa.selenium.By; import org.openqa.selenium.WebDriver; import org.openqa.selenium.WebElement; import org.openqa.selenium.chrome.ChromeDriver; public class SeleniumExample { public static void main(String[] args) { // Set up the WebDriver System.setProperty("webdriver.chrome.driver", "/path/to/chromedriver"); WebDriver driver = new ChromeDriver(); // Load the web page driver.get("http://www.bestreferat.ru/referat-32558.html"); // Wait for the div element to be filled with JavaScript WebElement tagsList = driver.findElement(By.id("tags_list")); WebDriverWait wait = new WebDriverWait(driver, 10); wait.until(ExpectedConditions.visibilityOf(tagsList)); // Get the tags from the div element List<webelement> tags = tagsList.findElements(By.tagName("a")); // Print the tags for (WebElement tag : tags) { System.out.println(tag.getText()); } // Close the WebDriver driver.close(); } }</webelement>這裡是一個使用Selenium 取得JavaScript 產生的內容的範例從您引用的頁面:此範例使用Selenium 載入網頁,等待要新增的JavaScript 產生的內容,然後從div 元素中檢索標籤。
以上是如何使用 JSoup 存取 JavaScript 產生的內容?的詳細內容。更多資訊請關注PHP中文網其他相關文章!

本文討論了使用Maven和Gradle進行Java項目管理,構建自動化和依賴性解決方案,以比較其方法和優化策略。

本文使用Maven和Gradle之類的工具討論了具有適當的版本控制和依賴關係管理的自定義Java庫(JAR文件)的創建和使用。

本文討論了使用咖啡因和Guava緩存在Java中實施多層緩存以提高應用程序性能。它涵蓋設置,集成和績效優勢,以及配置和驅逐政策管理最佳PRA

本文討論了使用JPA進行對象相關映射,並具有高級功能,例如緩存和懶惰加載。它涵蓋了設置,實體映射和優化性能的最佳實踐,同時突出潛在的陷阱。[159個字符]

Java的類上載涉及使用帶有引導,擴展程序和應用程序類負載器的分層系統加載,鏈接和初始化類。父代授權模型確保首先加載核心類別,從而影響自定義類LOA


熱AI工具

Undresser.AI Undress
人工智慧驅動的應用程序,用於創建逼真的裸體照片

AI Clothes Remover
用於從照片中去除衣服的線上人工智慧工具。

Undress AI Tool
免費脫衣圖片

Clothoff.io
AI脫衣器

AI Hentai Generator
免費產生 AI 無盡。

熱門文章

熱工具

WebStorm Mac版
好用的JavaScript開發工具

SAP NetWeaver Server Adapter for Eclipse
將Eclipse與SAP NetWeaver應用伺服器整合。

VSCode Windows 64位元 下載
微軟推出的免費、功能強大的一款IDE編輯器

SublimeText3漢化版
中文版,非常好用

Atom編輯器mac版下載
最受歡迎的的開源編輯器