Heim  >  Artikel  >  Web-Frontend  >  Leitfaden zum Lesen von Webseitenelementen

Leitfaden zum Lesen von Webseitenelementen

WBOY
WBOYOriginal
2024-04-09 12:39:021120Durchsuche

Um Webseitenelemente mit Python zu lesen, befolgen Sie diese Schritte: Importieren Sie den Webdriver aus der Selenium-Bibliothek. Starten Sie einen Browser wie Chrome Driver. Verwenden Sie die find_element_by_*-Methoden, um Webseitenelemente zu finden. Verwenden Sie element.text, um Elementtext zu lesen. Verwenden Sie element.get_attribute(), um Elementattribute zu lesen. Verwenden Sie element.location und element.size, um die Position und Größe des Elements zu lesen.

Leitfaden zum Lesen von Webseitenelementen

Leitfaden zum Lesen von Webelementen

Das Lesen von Webseitenelementen ist eine wichtige Aufgabe für die Website-Automatisierung und Datenextraktion. In diesem Artikel erfahren Sie, wie Sie den Text, die Attribute und die Position von Webseitenelementen mit Python und Selenium lesen.

Importieren Sie die erforderlichen Bibliotheken.

from selenium import webdriver

Starten Sie den Browser.

driver = webdriver.Chrome()  # 或其他浏览器驱动程序
find_element_by_id("my_id")

  • find_element_by_name("my_name")
  • find_element_by_class_name("my_class")
  • find_element_by_xpath("//element/path")

    find_element_by_* 方法查找元素:

    • find_element_by_id("my_id")
    • find_element_by_name("my_name")
    • find_element_by_class_name("my_class")
    • find_element_by_xpath("//element/path")
    • Elementtext lesen

    text = element.text
    Elementattribute lesen

    value = element.get_attribute("attribute_name")
    Elementposition lesen

    location = element.location  # 返回 {x, y} 坐标
    size = element.size  # 返回 {width, height}
    Praktischer Fall

    Extrahieren Sie Filmtitel und Bewertungen von der IMDb-Website:

    # 打开 IMDb 网站
    driver.get("https://www.imdb.com/")
    
    # 获取前 10 部电影的标题和评分
    titles = []
    ratings = []
    for i in range(1, 11):
        # 查找标题元素
        title_element = driver.find_element_by_xpath(f"(//h3)[{i}]/a")
        # 读标题
        title = title_element.text
    
        # 查找评分元素
        rating_element = driver.find_element_by_xpath(f"(//strong)[{i}]")
        # 读评分
        rating = rating_element.text
    
        titles.append(title)
        ratings.append(rating)
    
    # 打印结果
    for title, rating in zip(titles, ratings):
        print(f"{title}: {rating}")

    Dies führt zu ähnlichen Ergebnissen wie:

    The Shawshank Redemption: 9.3
    The Godfather: 9.2
    The Dark Knight: 9.0
    Schindler's List: 9.0
    12 Angry Men: 9.0
    ...

  • Das obige ist der detaillierte Inhalt vonLeitfaden zum Lesen von Webseitenelementen. Für weitere Informationen folgen Sie bitte anderen verwandten Artikeln auf der PHP chinesischen Website!

    Stellungnahme:
    Der Inhalt dieses Artikels wird freiwillig von Internetnutzern beigesteuert und das Urheberrecht liegt beim ursprünglichen Autor. Diese Website übernimmt keine entsprechende rechtliche Verantwortung. Wenn Sie Inhalte finden, bei denen der Verdacht eines Plagiats oder einer Rechtsverletzung besteht, wenden Sie sich bitte an admin@php.cn