通过 WebDriverWait 利用类规范
在涉及通过 JavaScript 加载动态内容的网站的网页抓取项目中,将 Selenium 库与 Python 集成可以提高效率通过允许控制元素识别和加载。这使得可以在继续抓取之前等待特定元素被渲染。
但是,当涉及按类而不是 ID 指定元素时,使用 EC.presence_of_element_ located((By.ID, "myDynamicElement")) 会呈现挑战。为了解决这个问题,By.class 不能与多个类名一起使用,从而导致错误。
解决方案
要克服此限制并按类有效指定元素,请考虑使用其他WebDriverWait ExpectedConditions方法,例如visibility_of_element_ located()或element_to_be_clickable()。此外,使用 CSS_SELECTOR 或 XPATH 允许组合 ID 和 CLASS 属性以进行精确识别:
CSS_SELECTOR:
element = WebDriverWait(driver, 20).until(EC.visibility_of_element_located( (By.CSS_SELECTOR, ".ng-binding.ng-scope#tabla_evolucion"))
XPATH:
element = WebDriverWait(driver, 20).until(EC.visibility_of_element_located( (By.XPATH, "//*[@class='ng-binding ng-scope' and @id='tabla_evolucion']"))
请记住,最合适的解决方案取决于您项目的具体要求以及网站的 HTML 结构。
以上是如何使用 WebDriverWait 和 Selenium 在动态网页中按类定位元素?的详细内容。更多信息请关注PHP中文网其他相关文章!