Selenium Python을 사용하여 섀도우 루트 내에서 정보를 추출하는 방법
Selenium은 추출 기능을 포함하여 웹 자동화를 위한 강력한 프레임워크를 제공합니다. 섀도우 루트와 같이 동적으로 로드된 웹 요소의 정보. 이 가이드는 섀도우 루트 내의 특정 온라인 상점에서 제품 라벨 및 기타 필드를 추출하는 문제를 극복하는 방법을 보여줍니다.
과제: 섀도우 루트에서 정보 추출
그림자 뿌리를 발견하면 요소 위치 및 추출을 위한 대체 전략을 탐색하는 것이 필요합니다. 기존의 XPath 접근 방식으로는 충분하지 않을 수 있습니다. 이 가이드는 Selenium의 Execute_script() 메소드를 활용하여 섀도우 루트에 액세스하고 원하는 정보를 검색하는 솔루션을 제시합니다.
해결책: ShadowRoot.querySelector() 사용
제품 라벨을 추출하려면 다음 접근 방식을 활용하세요.
<code class="python">driver.get('https://www.tiendasjumbo.co/buscar?q=mani') item = driver.execute_script("return document.querySelector('impulse-search').shadowRoot.querySelector('div.group-name-brand h1.impulse-title span.formatted-text')") print(item.text) </code>
출력:
La especial mezcla de nueces, maní, almendras y marañones x 450 g
결론
이 솔루션은 효과적으로 제품 라벨을 추출하는 방법을 보여줍니다. Selenium Python을 사용하여 섀도우 루트 내에서 정보를 수집하여 까다로운 시나리오에서도 웹 상호 작용을 자동화할 수 있는 안정적인 기술을 제공합니다.
위 내용은 Selenium Python을 사용하여 섀도우 루트 내에서 정보를 추출하는 방법은 무엇입니까?의 상세 내용입니다. 자세한 내용은 PHP 중국어 웹사이트의 기타 관련 기사를 참조하세요!