>  기사  >  백엔드 개발  >  Python에서 BeautifulSoup을 사용하여 \"href\" 속성을 추출하는 방법은 무엇입니까?

Python에서 BeautifulSoup을 사용하여 \"href\" 속성을 추출하는 방법은 무엇입니까?

DDD
DDD원래의
2024-10-28 21:42:02111검색

How to extract

BeautifulSoup으로 HREF 속성 추출

이 시나리오에서는 다음 HTML 콘텐츠에서 "some_url" href 속성을 추출하려고 합니다.

<code class="html"><a href="some_url">next</a>
<span class="class">...</span></code>

BeautifulSoup의 find_all() 메소드 활용

이 특정 속성을 검색하려면 다음과 같이 find_all() 메소드를 사용하세요.

<code class="python">from bs4 import BeautifulSoup

html = '''<a href="some_url">next</a>
<span class="class"><a href="another_url">later</a></span>'''

soup = BeautifulSoup(html)

for a in soup.find_all('a', href=True):
    print("Found the URL:", a['href'])</code>

Python 2에서 Python 3으로의 호환성

이 코드는 Python 2와 Python 3 모두에서 작동합니다. 그러나 이전 버전의 BeautifulSoup(버전 4 이전)에서는 find_all() 메서드가 이름은 findAll입니다.

HREF 속성이 있는 모든 태그 검색

태그 이름에 관계없이 href 속성을 보유한 모든 태그를 검색하려면 태그 이름 매개변수:

<code class="python">href_tags = soup.find_all(href=True)</code>

위 내용은 Python에서 BeautifulSoup을 사용하여 \"href\" 속성을 추출하는 방법은 무엇입니까?의 상세 내용입니다. 자세한 내용은 PHP 중국어 웹사이트의 기타 관련 기사를 참조하세요!

성명:
본 글의 내용은 네티즌들의 자발적인 기여로 작성되었으며, 저작권은 원저작자에게 있습니다. 본 사이트는 이에 상응하는 법적 책임을 지지 않습니다. 표절이나 침해가 의심되는 콘텐츠를 발견한 경우 admin@php.cn으로 문의하세요.