Python Tutorial

How to scrape javascript website with Python?

WBOYWBOYWBOYWBOYWBOYWBOYWBOYWBOYWBOYWBOYWBOYWBOYWB

Feb 10, 2024 pm 03:40 PM

webdriver

如何用 Python 抓取 javascript 网站？

Question content

I am trying to crawl a website. I've tried using both methods, but neither gives me the full website source code I'm looking for. I am trying to scrape news headlines from the website url provided below.

Website: "https://www.todayonline.com/"

Here are the two methods I tried and failed.

Method One: Beautiful Soup

tdy_url = "https://www.todayonline.com/"
page = requests.get(tdy_url).text
soup = beautifulsoup(page)
soup  # returns me a html with javascript text
soup.find_all('h3')

### returns me empty list []

Method 2: selenium beautifulsoup

tdy_url = "https://www.todayonline.com/"

options = Options()
options.headless = True

driver = webdriver.Chrome("chromedriver",options=options)

driver.get(tdy_url)
time.sleep(10)
html = driver.page_source

soup = BeautifulSoup(html)
soup.find_all('h3')

### Returns me only less than 1/4 of the 'h3' tags found in the original page source

please help. I've tried scraping other news sites and this is much easier. Thanks.

Correct answer

You can access the data through the api (look at the Network tab):

For example,

import requests
url = "https://www.todayonline.com/api/v3/news_feed/7"
data = requests.get(url).json()

The above is the detailed content of How to scrape javascript website with Python?. For more information, please follow other related articles on the PHP Chinese website!

Statement

This article is reproduced at:stackoverflow. If there is any infringement, please contact admin@php.cn delete

使用Python和WebDriver实现网页自动填写验证码Jul 07, 2023 am 10:19 AM

使用Python和WebDriver实现网页自动填写验证码随着网络的发展，越来越多的网站在用户注册、登录等操作中引入了验证码机制，以提高安全性和防止自动化攻击。然而，手动输入验证码不仅麻烦，还增加了用户体验的复杂度。那么，有没有一种方法能够自动填写验证码呢？答案是肯定的。本文将介绍如何使用Python和WebDriver实现网页自动填写验证码的方法。首先，我

Python和WebDriver扩展：在网页中模拟鼠标右键点击Jul 07, 2023 am 11:22 AM

Python和WebDriver扩展：在网页中模拟鼠标右键点击在使用Python和WebDriver进行网页自动化测试时，我们经常需要模拟用户的鼠标行为，例如点击、拖拽和右键菜单等操作。WebDriver会提供一些基本的鼠标行动函数，如click、drag_and_drop等，但是却没有直接提供模拟鼠标右键点击的函数。本文将介绍如何使用Python和WebD

构建可靠的PHP WebDriver测试环境: 从安装到优化Jun 15, 2023 pm 05:34 PM

近年来，随着Web应用程序的不断普及和复杂度的增加，自动化测试也变得越来越重要。PHPWebDriver是一个广泛使用的自动化测试工具，它可以模拟用户在网站上的行为，进行UI测试、功能测试等各种测试。但是，要使测试环境可靠、高效，我们需要进行一系列的安装和优化操作，本文将为您介绍具体步骤。安装SeleniumServerSelenium是一个自动化测试

使用Python和WebDriver在网页上自动点击按钮Jul 07, 2023 am 09:06 AM

使用Python和WebDriver在网页上自动点击按钮自动化测试在今天的软件开发领域中变得非常重要，它可以帮助开发人员提高效率，减少人为错误。在自动化测试中，模拟用户操作是非常关键的一步，而自动点击按钮是其中的常见需求之一。本文将介绍如何使用Python和WebDriver来实现在网页上自动点击按钮的功能。首先，我们需要安装Python的WebDriver

使用Python和WebDriver实现表单自动填写功能Jul 07, 2023 am 10:25 AM

使用Python和WebDriver实现表单自动填写功能在日常的网站浏览中，我们经常会遇到需要填写表单的情况。当我们需要频繁填写相同或类似的表单时，手动填写显得很繁琐而且耗时。所幸的是，我们可以借助Python和WebDriver来实现自动填写表单的功能，提高我们的工作效率。首先，我们需要安装selenium库。Selenium是一个自动化测试工具，可以模拟

使用Python和WebDriver实现网页自动填充日期选择器Jul 07, 2023 am 10:21 AM

使用Python和WebDriver实现网页自动填充日期选择器引言：在现代Web应用程序中，日期选择器是非常常见的，用户需要手动选择日期。然而，对于一些自动化测试和数据收集等场景，我们需要通过编程的方式自动填充日期选择器。本文将介绍如何使用Python和WebDriver来实现自动填充日期选择器的功能。一、准备工作：首先，我们需要安装Python和WebDr

利用Python和WebDriver扩展自动化处理网页的滑动验证码Jul 07, 2023 pm 01:04 PM

利用Python和WebDriver扩展自动化处理网页的滑动验证码引言：随着互联网的快速发展，为了确保网站的安全性和用户体验，很多网站都采用了各种形式的验证码。其中，滑动验证码被广泛应用于验证用户的真实性。但对于使用自动化测试工具的测试人员来说，滑动验证码却成为了一道难以逾越的鸿沟。然而，利用Python的selenium库以及WebDriver，我们可以轻

PHP和WebDriver扩展：如何模拟用户点击和输入操作Jul 07, 2023 pm 05:10 PM

PHP和WebDriver扩展：如何模拟用户点击和输入操作近年来，随着Web应用程序的快速发展，自动化测试变得越来越重要。在自动化测试中，模拟用户操作是一个关键的环节，它可以使我们更准确地测试和验证我们的应用程序。在PHP开发中，我们通常使用SeleniumWebDriver来实现自动化测试。SeleniumWebDriver是一种强大的工具，它可以模拟

See all articles