使用 Python 解析 HTML
问题:
如何访问和操作 HTML 元素使用Python解析器?我需要一个模块,允许我以结构化格式获取标签及其内容,类似于 Firefox 的“检查元素”功能中显示的嵌套结构。
答案:
BeautifulSoup
BeautifulSoup 模块是一个流行且功能强大的模块用于解析 HTML 的 Python 库。它可以将 HTML 转换为嵌套数据结构,使您可以轻松访问和导航 HTML 元素。
示例:
解析您提供的 HTML 文档:
from bs4 import BeautifulSoup html = "<html><head>Heading</head><body attr1='val1'><div class='container'><div>
获取“body”内“container”div的内容tag:
print(parsed_html.body.find('div', attrs={'class':'container'}).text)
其他选项:
以上是如何使用 Python 解析 HTML 并访问元素?的详细内容。更多信息请关注PHP中文网其他相关文章!