如何使用 Python 從動態 HTML 內容中提取值
從網站檢索資料時,遇到動態內容是很常見的。透過使用 Python 的標準函式庫(例如 requests),您可能無法存取這些在執行時間載入的值。
處理動態內容的解決方案
到克服這個挑戰,請考慮以下解決方案:
Selenium 用於值提取
Selenium 提供了一種全面的處理方法動態內容。使用方法如下:
Handlebars 驅動網站的範例
考慮一個使用 Handlebars 範本的網站。要擷取「中位數」值:
<code class="python">from bs4 import BeautifulSoup from selenium import webdriver driver = webdriver.Firefox() driver.get('http://eve-central.com/home/quicklook.html?typeid=34') html = driver.page_source soup = BeautifulSoup(html) for tag in soup.find_all("div", class_="priceContainer"): print tag.text</code>
此範例示範如何使用 Selenium 存取渲染的 HTML 並使用 BeautifulSoup 解析它。
以上是如何使用 Python 提取動態 HTML 內容值?的詳細內容。更多資訊請關注PHP中文網其他相關文章!