如何使用 Python 从动态 HTML 内容中提取值
从网站检索数据时,遇到动态内容是很常见的。通过使用 Python 的标准库(例如 requests),您可能无法访问这些在运行时加载的值。
处理动态内容的解决方案
到克服这一挑战,请考虑以下解决方案:
Selenium 用于值提取
Selenium 提供了一种全面的处理方法动态内容。使用方法如下:
Handlebars 驱动网站的示例
考虑一个使用 Handlebars 模板的网站。要提取“中值”值:
<code class="python">from bs4 import BeautifulSoup from selenium import webdriver driver = webdriver.Firefox() driver.get('http://eve-central.com/home/quicklook.html?typeid=34') html = driver.page_source soup = BeautifulSoup(html) for tag in soup.find_all("div", class_="priceContainer"): print tag.text</code>
此示例演示如何使用 Selenium 访问渲染的 HTML 并使用 BeautifulSoup 解析它。
以上是如何使用 Python 提取动态 HTML 内容值?的详细内容。更多信息请关注PHP中文网其他相关文章!