在Python 中抓取由JavaScript 產生的動態內容
Web 抓取經常會遇到包含由JavaScript 驅動的動態內容的頁面。要有效地抓取此類頁面,執行 JavaScript 程式碼至關重要。
將 Selenium 與 PhantomJS 結合使用
Selenium 是一個流行的 Python 庫,用於自動化 Web 瀏覽器。它可以與 PhantomJS(無頭瀏覽器)一起使用來渲染網頁並執行 JavaScript。
from selenium import webdriver driver = webdriver.PhantomJS() driver.get(my_url) p_element = driver.find_element_by_id(id_='intro-text') print(p_element.text)使用 pip install 安裝 dryscrape dryscrape。 使用以下程式碼:
以上是如何在 Python 中抓取動態 JavaScript 內容?的詳細內容。更多資訊請關注PHP中文網其他相關文章!