搜索
首页后端开发Python教程如何用 Python 抓取 javascript 网站?

如何用 Python 抓取 javascript 网站?

问题内容

我正在尝试抓取一个网站。我尝试过使用两种方法,但两种方法都没有为我提供我正在寻找的完整网站源代码。我正在尝试从下面提供的网站 url 中抓取新闻标题。

网址:“https://www.todayonline.com/”

这是我尝试过但失败的两种方法。

方法一:美汤

tdy_url = "https://www.todayonline.com/"
page = requests.get(tdy_url).text
soup = beautifulsoup(page)
soup  # returns me a html with javascript text
soup.find_all('h3')

### returns me empty list []

方法2:selenium + beautifulsoup

tdy_url = "https://www.todayonline.com/"

options = Options()
options.headless = True

driver = webdriver.Chrome("chromedriver",options=options)

driver.get(tdy_url)
time.sleep(10)
html = driver.page_source

soup = BeautifulSoup(html)
soup.find_all('h3')

### Returns me only less than 1/4 of the 'h3' tags found in the original page source

请帮忙。我尝试过抓取其他新闻网站,这要容易得多。谢谢。


正确答案


您可以通过 api 访问数据(查看“网络”选项卡):

例如,

import requests
url = "https://www.todayonline.com/api/v3/news_feed/7"
data = requests.get(url).json()

以上是如何用 Python 抓取 javascript 网站?的详细内容。更多信息请关注PHP中文网其他相关文章!

声明
本文转载于:stackoverflow。如有侵权,请联系admin@php.cn删除
使用Python和WebDriver实现网页自动填写验证码使用Python和WebDriver实现网页自动填写验证码Jul 07, 2023 am 10:19 AM

使用Python和WebDriver实现网页自动填写验证码随着网络的发展,越来越多的网站在用户注册、登录等操作中引入了验证码机制,以提高安全性和防止自动化攻击。然而,手动输入验证码不仅麻烦,还增加了用户体验的复杂度。那么,有没有一种方法能够自动填写验证码呢?答案是肯定的。本文将介绍如何使用Python和WebDriver实现网页自动填写验证码的方法。首先,我

Python和WebDriver扩展:在网页中模拟鼠标右键点击Python和WebDriver扩展:在网页中模拟鼠标右键点击Jul 07, 2023 am 11:22 AM

Python和WebDriver扩展:在网页中模拟鼠标右键点击在使用Python和WebDriver进行网页自动化测试时,我们经常需要模拟用户的鼠标行为,例如点击、拖拽和右键菜单等操作。WebDriver会提供一些基本的鼠标行动函数,如click、drag_and_drop等,但是却没有直接提供模拟鼠标右键点击的函数。本文将介绍如何使用Python和WebD

构建可靠的PHP WebDriver测试环境: 从安装到优化构建可靠的PHP WebDriver测试环境: 从安装到优化Jun 15, 2023 pm 05:34 PM

近年来,随着Web应用程序的不断普及和复杂度的增加,自动化测试也变得越来越重要。PHPWebDriver是一个广泛使用的自动化测试工具,它可以模拟用户在网站上的行为,进行UI测试、功能测试等各种测试。但是,要使测试环境可靠、高效,我们需要进行一系列的安装和优化操作,本文将为您介绍具体步骤。安装SeleniumServerSelenium是一个自动化测试

使用Python和WebDriver在网页上自动点击按钮使用Python和WebDriver在网页上自动点击按钮Jul 07, 2023 am 09:06 AM

使用Python和WebDriver在网页上自动点击按钮自动化测试在今天的软件开发领域中变得非常重要,它可以帮助开发人员提高效率,减少人为错误。在自动化测试中,模拟用户操作是非常关键的一步,而自动点击按钮是其中的常见需求之一。本文将介绍如何使用Python和WebDriver来实现在网页上自动点击按钮的功能。首先,我们需要安装Python的WebDriver

使用Python和WebDriver实现表单自动填写功能使用Python和WebDriver实现表单自动填写功能Jul 07, 2023 am 10:25 AM

使用Python和WebDriver实现表单自动填写功能在日常的网站浏览中,我们经常会遇到需要填写表单的情况。当我们需要频繁填写相同或类似的表单时,手动填写显得很繁琐而且耗时。所幸的是,我们可以借助Python和WebDriver来实现自动填写表单的功能,提高我们的工作效率。首先,我们需要安装selenium库。Selenium是一个自动化测试工具,可以模拟

使用Python和WebDriver实现网页自动填充日期选择器使用Python和WebDriver实现网页自动填充日期选择器Jul 07, 2023 am 10:21 AM

使用Python和WebDriver实现网页自动填充日期选择器引言:在现代Web应用程序中,日期选择器是非常常见的,用户需要手动选择日期。然而,对于一些自动化测试和数据收集等场景,我们需要通过编程的方式自动填充日期选择器。本文将介绍如何使用Python和WebDriver来实现自动填充日期选择器的功能。一、准备工作:首先,我们需要安装Python和WebDr

利用Python和WebDriver扩展自动化处理网页的滑动验证码利用Python和WebDriver扩展自动化处理网页的滑动验证码Jul 07, 2023 pm 01:04 PM

利用Python和WebDriver扩展自动化处理网页的滑动验证码引言:随着互联网的快速发展,为了确保网站的安全性和用户体验,很多网站都采用了各种形式的验证码。其中,滑动验证码被广泛应用于验证用户的真实性。但对于使用自动化测试工具的测试人员来说,滑动验证码却成为了一道难以逾越的鸿沟。然而,利用Python的selenium库以及WebDriver,我们可以轻

PHP和WebDriver扩展:如何模拟用户点击和输入操作PHP和WebDriver扩展:如何模拟用户点击和输入操作Jul 07, 2023 pm 05:10 PM

PHP和WebDriver扩展:如何模拟用户点击和输入操作近年来,随着Web应用程序的快速发展,自动化测试变得越来越重要。在自动化测试中,模拟用户操作是一个关键的环节,它可以使我们更准确地测试和验证我们的应用程序。在PHP开发中,我们通常使用SeleniumWebDriver来实现自动化测试。SeleniumWebDriver是一种强大的工具,它可以模拟

See all articles

热AI工具

Undresser.AI Undress

Undresser.AI Undress

人工智能驱动的应用程序,用于创建逼真的裸体照片

AI Clothes Remover

AI Clothes Remover

用于从照片中去除衣服的在线人工智能工具。

Undress AI Tool

Undress AI Tool

免费脱衣服图片

Clothoff.io

Clothoff.io

AI脱衣机

AI Hentai Generator

AI Hentai Generator

免费生成ai无尽的。

热门文章

R.E.P.O.能量晶体解释及其做什么(黄色晶体)
2 周前By尊渡假赌尊渡假赌尊渡假赌
仓库:如何复兴队友
1 个月前By尊渡假赌尊渡假赌尊渡假赌
Hello Kitty Island冒险:如何获得巨型种子
4 周前By尊渡假赌尊渡假赌尊渡假赌

热工具

SublimeText3汉化版

SublimeText3汉化版

中文版,非常好用

螳螂BT

螳螂BT

Mantis是一个易于部署的基于Web的缺陷跟踪工具,用于帮助产品缺陷跟踪。它需要PHP、MySQL和一个Web服务器。请查看我们的演示和托管服务。

MinGW - 适用于 Windows 的极简 GNU

MinGW - 适用于 Windows 的极简 GNU

这个项目正在迁移到osdn.net/projects/mingw的过程中,你可以继续在那里关注我们。MinGW:GNU编译器集合(GCC)的本地Windows移植版本,可自由分发的导入库和用于构建本地Windows应用程序的头文件;包括对MSVC运行时的扩展,以支持C99功能。MinGW的所有软件都可以在64位Windows平台上运行。

禅工作室 13.0.1

禅工作室 13.0.1

功能强大的PHP集成开发环境

SublimeText3 Mac版

SublimeText3 Mac版

神级代码编辑软件(SublimeText3)