启用 Javascript 的页面的请求
Requests 是一个强大的 Python HTTP 库,但它很难从严重依赖的网站中提取内容在 JavaScript 上。这是因为 JavaScript 通常在客户端运行,在初始页面加载后动态生成内容。
解决方案:Requests-HTML
幸运的是,Requests 社区已经开发了解决方案:requests-html。该模块为Requests添加了JavaScript渲染功能,允许您与使用JavaScript的页面进行交互。
用法:
使用Requests-HTML:
渲染 JavaScript:
访问内容:
渲染 JavaScript 后,您可以像使用一样访问内容常规 HTML。例如:
<code class="python">r.html.find('#myElementID').text</code>
这将返回 ID 为“myElementID”的 HTML 元素的内容。
其他功能:
请求-HTML 封装了 BeautifulSoup,允许您执行其他操作,例如:
通过使用 Requests-HTML,您可以轻松地从支持 JavaScript 的网站检索数据,而不会牺牲 Requests 的简单性和强大功能。
以上是如何使用 Python 中的请求从严重依赖 JavaScript 的网站中抓取内容?的详细内容。更多信息请关注PHP中文网其他相关文章!