使用 BeautifulSoup 提取 HREF 属性
在这种情况下,您想要从以下 HTML 内容中提取“some_url”href 属性:
<code class="html"><a href="some_url">next</a> <span class="class">...</span></code>
利用 BeautifulSoup 的 find_all() 方法
要检索此特定属性,请使用 find_all() 方法,如下所示:
<code class="python">from bs4 import BeautifulSoup html = '''<a href="some_url">next</a> <span class="class"><a href="another_url">later</a></span>''' soup = BeautifulSoup(html) for a in soup.find_all('a', href=True): print("Found the URL:", a['href'])</code>
Python 2 到 Python 3 兼容性
请注意,此代码适用于 Python 2 和 Python 3。但是,在旧版本的 BeautifulSoup(版本 4 之前)中,find_all() 方法被命名为 findAll。
检索具有 HREF 属性的所有标签
如果您希望检索拥有 href 属性的所有标签,无论其标签名称如何,只需省略标签名称参数:
<code class="python">href_tags = soup.find_all(href=True)</code>
以上是如何在Python中使用BeautifulSoup提取'href”属性?的详细内容。更多信息请关注PHP中文网其他相关文章!