Python을 사용하여 동적 HTML 콘텐츠에서 값을 추출하는 방법
웹사이트에서 데이터를 검색할 때 동적 콘텐츠를 접하는 것이 일반적입니다. 요청과 같은 Python의 표준 라이브러리를 사용하면 런타임에 로드되는 값에 액세스하지 못할 수도 있습니다.
동적 콘텐츠 처리 솔루션
이 문제를 극복하려면 다음 솔루션을 고려하십시오.
값 추출을 위한 Selenium
Selenium은 처리를 위한 포괄적인 접근 방식을 제공합니다. 동적 콘텐츠. 사용 방법은 다음과 같습니다.
핸들바 기반 사이트의 예
핸들바 템플릿을 사용하는 웹사이트를 생각해 보세요. "중앙값"을 추출하려면:
<code class="python">from bs4 import BeautifulSoup from selenium import webdriver driver = webdriver.Firefox() driver.get('http://eve-central.com/home/quicklook.html?typeid=34') html = driver.page_source soup = BeautifulSoup(html) for tag in soup.find_all("div", class_="priceContainer"): print tag.text</code>
이 예에서는 Selenium을 사용하여 렌더링된 HTML에 액세스하고 이를 BeautifulSoup으로 구문 분석하는 방법을 보여줍니다.
위 내용은 Python으로 동적 HTML 콘텐츠 값을 추출하는 방법은 무엇입니까?의 상세 내용입니다. 자세한 내용은 PHP 중국어 웹사이트의 기타 관련 기사를 참조하세요!