>  기사  >  백엔드 개발  >  Python의 HTML 테이블에서 데이터를 추출하는 데 BeautifulSoup을 어떻게 사용할 수 있나요?

Python의 HTML 테이블에서 데이터를 추출하는 데 BeautifulSoup을 어떻게 사용할 수 있나요?

Patricia Arquette
Patricia Arquette원래의
2024-10-28 10:00:29971검색

How can BeautifulSoup be used to extract data from a HTML table in Python?

BeautifulSoup 구문 분석 테이블

Python에서 BeautifulSoup은 HTML 문서를 구문 분석하는 강력한 방법을 제공합니다. 테이블에서 특정 데이터를 검색해야 하는 이와 같은 시나리오에 직면했을 때 BeautifulSoup가 유용합니다.

타겟팅된 광고 항목 테이블을 추출하려면 Soup.find()를 활용하고 괄호. 이 경우 다음이 필요합니다.

<code class="python">table = soup.find("table", {"class": "lineItemsTable"})</code>

다음으로 table.findAll("tr")을 사용하여 테이블의 각 행을 반복할 수 있습니다. 각 행 내에서 row.findAll("td")를 사용하여 테이블 셀(td)에 액세스할 수 있습니다.

다음은 향상된 코드 조각입니다.

<code class="python">data = []
table_body = table.find('tbody')

rows = table_body.find_all('tr')
for row in rows:
    cols = row.find_all('td')
    cols = [ele.text.strip() for ele in cols]
    data.append([ele for ele in cols if ele])  # Remove empty values</code>

이 코드는 목록을 생성합니다. 각 하위 목록은 테이블의 행을 나타내는 목록입니다. 웹사이트에서 필요한 데이터를 효율적으로 캡처합니다.

위 내용은 Python의 HTML 테이블에서 데이터를 추출하는 데 BeautifulSoup을 어떻게 사용할 수 있나요?의 상세 내용입니다. 자세한 내용은 PHP 중국어 웹사이트의 기타 관련 기사를 참조하세요!

성명:
본 글의 내용은 네티즌들의 자발적인 기여로 작성되었으며, 저작권은 원저작자에게 있습니다. 본 사이트는 이에 상응하는 법적 책임을 지지 않습니다. 표절이나 침해가 의심되는 콘텐츠를 발견한 경우 admin@php.cn으로 문의하세요.