Python에서 BeautifulSoup은 HTML 문서를 구문 분석하는 강력한 방법을 제공합니다. 테이블에서 특정 데이터를 검색해야 하는 이와 같은 시나리오에 직면했을 때 BeautifulSoup가 유용합니다.
타겟팅된 광고 항목 테이블을 추출하려면 Soup.find()를 활용하고 괄호. 이 경우 다음이 필요합니다.
<code class="python">table = soup.find("table", {"class": "lineItemsTable"})</code>
다음으로 table.findAll("tr")을 사용하여 테이블의 각 행을 반복할 수 있습니다. 각 행 내에서 row.findAll("td")를 사용하여 테이블 셀(td)에 액세스할 수 있습니다.
다음은 향상된 코드 조각입니다.
<code class="python">data = [] table_body = table.find('tbody') rows = table_body.find_all('tr') for row in rows: cols = row.find_all('td') cols = [ele.text.strip() for ele in cols] data.append([ele for ele in cols if ele]) # Remove empty values</code>
이 코드는 목록을 생성합니다. 각 하위 목록은 테이블의 행을 나타내는 목록입니다. 웹사이트에서 필요한 데이터를 효율적으로 캡처합니다.
위 내용은 Python의 HTML 테이블에서 데이터를 추출하는 데 BeautifulSoup을 어떻게 사용할 수 있나요?의 상세 내용입니다. 자세한 내용은 PHP 중국어 웹사이트의 기타 관련 기사를 참조하세요!