>  기사  >  백엔드 개발  >  Selenium Python을 사용하여 Shadow-Root 요소에서 제품 정보를 추출하는 방법은 무엇입니까?

Selenium Python을 사용하여 Shadow-Root 요소에서 제품 정보를 추출하는 방법은 무엇입니까?

Susan Sarandon
Susan Sarandon원래의
2024-10-19 06:40:02344검색

How to Extract Product Information from Shadow-Root Elements Using Selenium Python?

Selenium Python을 사용하여 Shadow-Root 요소에서 정보 추출

이 게시물에서는 웹사이트 https에서 제품 정보를 추출하는 문제를 다룹니다. ://www.tiendasjumbo.co/buscar?q=mani. 이러한 요소는 #shadow-root(개방형) 요소 내에 배치되므로 기존 추출 방법이 효과적이지 않습니다.

Shadow-Root 이해

Shadow-root는 기술입니다. DOM 요소를 캡슐화하여 기본 HTML 문서에서 숨기는 데 사용됩니다. 섀도우 루트 내의 요소에 액세스하려면 특정 섀도우 루트 로케이터를 활용해야 합니다.

해결책: ShadowRoot.querySelector() 사용

제품 라벨을 추출하려면, 우리는 다음 전략을 구현합니다:

  1. 섀도우 루트에 액세스: 임펄스 검색 요소를 얻고 해당 섀도우 루트에 액세스합니다.
  2. 사용 ShadowRoot.querySelector(): 섀도우 루트 내에서 탐색하고 선택기를 사용하여 원하는 요소를 찾습니다. 이 경우에는 제품 라벨입니다.

코드 예:

<code class="python">from selenium import webdriver
from random import randint

driver = webdriver.Firefox(executable_path="C:\Program Files (x86)\geckodriver.exe")
time.sleep(4)

url = "https://www.tiendasjumbo.co/buscar?q=mani"
driver.maximize_window()
driver.get(url)

item = driver.execute_script("return document.querySelector('impulse-search').shadowRoot.querySelector('div.group-name-brand h1.impulse-title span.formatted-text')")
print(item.text)</code>

이 코드는 제공된 URL에 대한 제품 라벨을 인쇄합니다.

추가 참고 사항:

  • Microsoft Edge 및 Google Chrome 버전 96의 경우 섀도우 루트 액세스를 처리하려면 특정 기술이 필요합니다. 자세한 내용은 제공된 참고 자료를 참조하세요.
  • 자세한 논의와 예시를 위한 참고 자료가 포함되어 있습니다.

위 내용은 Selenium Python을 사용하여 Shadow-Root 요소에서 제품 정보를 추출하는 방법은 무엇입니까?의 상세 내용입니다. 자세한 내용은 PHP 중국어 웹사이트의 기타 관련 기사를 참조하세요!

성명:
본 글의 내용은 네티즌들의 자발적인 기여로 작성되었으며, 저작권은 원저작자에게 있습니다. 본 사이트는 이에 상응하는 법적 책임을 지지 않습니다. 표절이나 침해가 의심되는 콘텐츠를 발견한 경우 admin@php.cn으로 문의하세요.