首頁 >後端開發 >Python教學 >如何使用 Python 解析 HTML 並存取元素?

如何使用 Python 解析 HTML 並存取元素?

Linda Hamilton
Linda Hamilton原創
2024-12-13 22:27:15783瀏覽

How Can I Parse HTML and Access Elements Using Python?

使用Python 解析HTML

問題:

問題:

如何存取🎜>問題:

如何存取元素和操作元素解析器?我需要一個模組,允許我以結構化格式取得標籤及其內容,類似於 Firefox 的「檢查元素」功能中顯示的嵌套結構。

答案:

BeautifulSoup

BeautifulSoup 模組是一個流行且功能強大的模組用於解析。它可以將 HTML 轉換為嵌套資料結構,使您可以輕鬆存取和導航 HTML 元素。
from bs4 import BeautifulSoup

html = "<html><head>Heading</head><body attr1='val1'><div class='container'><div>

範例:
print(parsed_html.body.find('div', attrs={'class':'container'}).text)

解析您提供的 HTML 文件:

    取得「身體」內「container」div的內容tag:
  • 其他選項:
lxml: 快速且有效率的XML 和HTML 解析器,支援進階功能,例如作為XPath。 HTMLParser: A內建 Python 模組,提供基本的 HTML 解析器。

以上是如何使用 Python 解析 HTML 並存取元素?的詳細內容。更多資訊請關注PHP中文網其他相關文章!

陳述:
本文內容由網友自願投稿,版權歸原作者所有。本站不承擔相應的法律責任。如發現涉嫌抄襲或侵權的內容,請聯絡admin@php.cn