Maison  >  Article  >  interface Web  >  Guide de lecture des éléments d'une page Web

Guide de lecture des éléments d'une page Web

WBOY
WBOYoriginal
2024-04-09 12:39:021120parcourir

Pour lire des éléments de page Web à l'aide de Python, suivez ces étapes : Importez le pilote Web depuis la bibliothèque Selenium. Lancez un navigateur tel que Chrome Driver. Utilisez les méthodes find_element_by_* pour rechercher des éléments de page Web. Utilisez element.text pour lire le texte de l'élément. Utilisez element.get_attribute() pour lire les attributs des éléments. Utilisez element.location et element.size pour lire la position et la taille de l'élément.

Guide de lecture des éléments dune page Web

Guide de lecture des éléments Web

La lecture des éléments de page Web est une tâche critique pour l'automatisation de sites Web et l'extraction de données. Cet article vous expliquera comment lire le texte, les attributs et la position des éléments de page Web à l'aide de Python et Selenium.

Importez les bibliothèques nécessaires

from selenium import webdriver

Lancez le navigateur

driver = webdriver.Chrome()  # 或其他浏览器驱动程序

Trouver des éléments de page Web

Utilisez la méthode find_element_by_* de Selenium pour rechercher des éléments : find_element_by_* 方法查找元素:

  • find_element_by_id("my_id")
  • find_element_by_name("my_name")
  • find_element_by_class_name("my_class")
  • find_element_by_xpath("//element/path")
    • find_element_by_id("my_id")
    • find_element_by_name("my_name")
  • find_element_by_class_name("my_class")

  • find_element_by_xpath("//element/path")

    Lire le texte de l'élément

    text = element.text

    Lire les attributs de l'élément

    value = element.get_attribute("attribute_name")

    Lire la position de l'élément

    location = element.location  # 返回 {x, y} 坐标
    size = element.size  # 返回 {width, height}

    Cas pratique

    Extraire les titres et classements des films du site IMDb : 🎜
    # 打开 IMDb 网站
    driver.get("https://www.imdb.com/")
    
    # 获取前 10 部电影的标题和评分
    titles = []
    ratings = []
    for i in range(1, 11):
        # 查找标题元素
        title_element = driver.find_element_by_xpath(f"(//h3)[{i}]/a")
        # 读标题
        title = title_element.text
    
        # 查找评分元素
        rating_element = driver.find_element_by_xpath(f"(//strong)[{i}]")
        # 读评分
        rating = rating_element.text
    
        titles.append(title)
        ratings.append(rating)
    
    # 打印结果
    for title, rating in zip(titles, ratings):
        print(f"{title}: {rating}")
    🎜Cela affichera des résultats similaires à : 🎜
    The Shawshank Redemption: 9.3
    The Godfather: 9.2
    The Dark Knight: 9.0
    Schindler's List: 9.0
    12 Angry Men: 9.0
    ...

Ce qui précède est le contenu détaillé de. pour plus d'informations, suivez d'autres articles connexes sur le site Web de PHP en chinois!

Déclaration:
Le contenu de cet article est volontairement contribué par les internautes et les droits d'auteur appartiennent à l'auteur original. Ce site n'assume aucune responsabilité légale correspondante. Si vous trouvez un contenu suspecté de plagiat ou de contrefaçon, veuillez contacter admin@php.cn