tutorial js

关于selenium用法的详解

jacklove

Jun 11, 2018 pm 05:53 PM

selenium

selenium用法详解

*selenium主要是用来做自动化测试，支持多种浏览器，爬虫中主要用来解决JavaScript渲染问题。
模拟浏览器进行网页加载，当requests,urllib无法正常获取网页内容的时候*

一、声明浏览器对象
注意点一，Python文件名或者包名不要命名为selenium，会导致无法导入

from selenium import webdriver

webdriver可以认为是浏览器的驱动器，要驱动浏览器必须用到webdriver，支持多种浏览器，这里以Chrome为例

browser = webdriver.Chrome()

二、访问页面并获取网页html

from selenium import webdriver
browser = webdriver.Chrome()
browser.get(&#39;https://www.taobao.com&#39;)
print(browser.page_source) # browser.page_source是获取网页的全部htmlbrowser.close()

三、查找元素
单个元素

from selenium import webdriver
browser = webdriver.Chrome()
browser.get(&#39;https://www.taobao.com&#39;)
input_first = browser.find_element_by_id(&#39;q&#39;)
input_second = browser.find_element_by_css_selector(&#39;#q&#39;)
input_third = browser.find_element_by_xpath(&#39;//*[@id="q"]&#39;)
print(input_first,input_second,input_third)
browser.close()

常用的查找方法

find_element_by_name
find_element_by_xpath
find_element_by_link_text
find_element_by_partial_link_text
find_element_by_tag_name
find_element_by_class_name
find_element_by_css_selector

也可以使用通用的方法

from selenium import webdriverfrom selenium.webdriver.common.by import By
browser = webdriver.Chrome()
browser.get(&#39;https://www.taobao.com&#39;)
input_first = browser.find_element(BY.ID,&#39;q&#39;)#第一个参数传入名称，第二个传入具体的参数print(input_first)
browser.close()

多个元素，elements多个s

input_first = browser.find_elements_by_id(&#39;q&#39;)

四、元素交互操作-搜索框传入关键词进行自动搜索

from selenium import webdriver
import timebrowser = webdriver.Chrome()
browser.get(&#39;https://www.taobao.com&#39;)
input = browser.find_element_by_id(&#39;q&#39;)#找到搜索框input.send_keys(&#39;iPhone&#39;)#传送入关键词time.sleep(5)
input.clear()#清空搜索框input.send_keys(&#39;男士内裤&#39;)
button = browser.find_element_by_class_name(&#39;btn-search&#39;)#找到搜索按钮button.click()

更多操作: http://selenium-python.readthedocs.io/api.html#module-selenium.webdriver.remote.webelement#可以有属性、截图等等

五、交互动作，驱动浏览器进行动作，模拟拖拽动作，将动作附加到动作链中串行执行

from selenium import webdriverfrom selenium.webdriver import ActionChains#引入动作链browser = webdriver.Chrome()
url = &#39;http://www.runoob.com/try/try.php?filename=jqueryui-api-droppable&#39;browser.get(url)
browser.switch_to.frame(&#39;iframeResult&#39;)#切换到iframeResult框架source = browser.find_element_by_css_selector(&#39;#draggable&#39;)#找到被拖拽对象target = browser.find_element_by_css_selector(&#39;#droppable&#39;)#找到目标actions = ActionChains(browser)#声明actions对象actions.drag_and_drop(source, target)
actions.perform()#执行动作

更多操作: http://selenium-python.readthedocs.io/api.html#module-selenium.webdriver.common.action_chains

六、执行JavaScript
有些动作可能没有提供api，比如进度条下拉，这时，我们可以通过代码执行JavaScript

from selenium import webdriver
browser = webdriver.Chrome()
browser.get(&#39;https://www.zhihu.com/explore&#39;)
browser.execute_script(&#39;window.scrollTo(0, document.body.scrollHeight)&#39;)
browser.execute_script(&#39;alert("To Bottom")&#39;)

七、获取元素信息
获取属性

from selenium import webdriverfrom selenium.webdriver import ActionChains
browser = webdriver.Chrome()
url = &#39;https://www.zhihu.com/explore&#39;browser.get(url)
logo = browser.find_element_by_id(&#39;zh-top-link-logo&#39;)#获取网站logoprint(logo)
print(logo.get_attribute(&#39;class&#39;))
browser.close()

获取文本值

from selenium import webdriver
browser = webdriver.Chrome()
url = &#39;https://www.zhihu.com/explore&#39;browser.get(url)
input = browser.find_element_by_class_name(&#39;zu-top-add-question&#39;)
print(input.text)#input.text文本值browser.close()

获取Id，位置，标签名，大小

from selenium import webdriver
browser = webdriver.Chrome()
url = &#39;https://www.zhihu.com/explore&#39;browser.get(url)
input = browser.find_element_by_class_name(&#39;zu-top-add-question&#39;)
print(input.id)#获取idprint(input.location)#获取位置print(input.tag_name)#获取标签名print(input.size)#获取大小browser.close()

八、Frame操作
frame相当于独立的网页，如果在父类网frame查找子类的，则必须切换到子类的frame，子类如果查找父类也需要先切换

from selenium import webdriverfrom selenium.common.exceptions import NoSuchElementException
browser = webdriver.Chrome()
url = &#39;http://www.runoob.com/try/try.php?filename=jqueryui-api-droppable&#39;browser.get(url)
browser.switch_to.frame(&#39;iframeResult&#39;)
source = browser.find_element_by_css_selector(&#39;#draggable&#39;)
print(source)try:
    logo = browser.find_element_by_class_name(&#39;logo&#39;)except NoSuchElementException:
    print(&#39;NO LOGO&#39;)
browser.switch_to.parent_frame()
logo = browser.find_element_by_class_name(&#39;logo&#39;)
print(logo)
print(logo.text)

九、等待

隐式等待
当使用了隐式等待执行测试的时候，如果 WebDriver没有在 DOM中找到元素，将继续等待，超出设定时间后则抛出找不到元素的异常,
换句话说，当查找元素或元素并没有立即出现的时候，隐式等待将等待一段时间再查找 DOM，默认的时间是0

from selenium import webdriver
browser = webdriver.Chrome()
browser.implicitly_wait(10)#等待十秒加载不出来就会抛出异常，10秒内加载出来正常返回browser.get(&#39;https://www.zhihu.com/explore&#39;)
input = browser.find_element_by_class_name(&#39;zu-top-add-question&#39;)
print(input)

显式等待
指定一个等待条件，和一个最长等待时间，程序会判断在等待时间内条件是否满足，如果满足则返回，如果不满足会继续等待，超过时间就会抛出异常

from selenium import webdriverfrom selenium.webdriver.common.by import Byfrom selenium.webdriver.support.ui import WebDriverWaitfrom selenium.webdriver.support import expected_conditions as EC
browser = webdriver.Chrome()
browser.get(&#39;https://www.taobao.com/&#39;)wait = WebDriverWait(browser, 10)
input = wait.until(EC.presence_of_element_located((By.ID, &#39;q&#39;)))
button = wait.until(EC.element_to_be_clickable((By.CSS_SELECTOR, &#39;.btn-search&#39;)))
print(input, button)

title_is 标题是某内容
title_contains 标题包含某内容
presence_of_element_located 元素加载出，传入定位元组，如(By.ID, &#39;p&#39;)
visibility_of_element_located 元素可见，传入定位元组
visibility_of 可见，传入元素对象
presence_of_all_elements_located 所有元素加载出
text_to_be_present_in_element 某个元素文本包含某文字
text_to_be_present_in_element_value 某个元素值包含某文字
frame_to_be_available_and_switch_to_it frame加载并切换
invisibility_of_element_located 元素不可见
element_to_be_clickable 元素可点击
staleness_of 判断一个元素是否仍在DOM，可判断页面是否已经刷新
element_to_be_selected 元素可选择，传元素对象
element_located_to_be_selected 元素可选择，传入定位元组
element_selection_state_to_be 传入元素对象以及状态，相等返回True，否则返回False
element_located_selection_state_to_be 传入定位元组以及状态，相等返回True，否则返回False
alert_is_present 是否出现Alert

详细内容：http://selenium-python.readthedocs.io/api.html#module-selenium.webdriver.support.expected_conditions

十一、前进后退-实现浏览器的前进后退以浏览不同的网页

import timefrom selenium import webdriver
browser = webdriver.Chrome()
browser.get(&#39;https://www.baidu.com/&#39;)
browser.get(&#39;https://www.taobao.com/&#39;)
browser.get(&#39;https://www.python.org/&#39;)
browser.back()time.sleep(1)
browser.forward()
browser.close()

十二、Cookies

from selenium import webdriver
browser = webdriver.Chrome()
browser.get(&#39;https://www.zhihu.com/explore&#39;)
print(browser.get_cookies())
browser.add_cookie({&#39;name&#39;: &#39;name&#39;, &#39;domain&#39;: &#39;www.zhihu.com&#39;, &#39;value&#39;: &#39;germey&#39;})
print(browser.get_cookies())
browser.delete_all_cookies()
print(browser.get_cookies())

选项卡管理增加浏览器窗口

import timefrom selenium import webdriver
browser = webdriver.Chrome()
browser.get(&#39;https://www.baidu.com&#39;)
browser.execute_script(&#39;window.open()&#39;)
print(browser.window_handles)
browser.switch_to_window(browser.window_handles[1])
browser.get(&#39;https://www.taobao.com&#39;)time.sleep(1)
browser.switch_to_window(browser.window_handles[0])
browser.get(&#39;http://www.fishc.com&#39;)

十三、异常处理

from selenium import webdriver
browser = webdriver.Chrome()
browser.get(&#39;https://www.baidu.com&#39;)
browser.find_element_by_id(&#39;hello&#39;)from selenium import webdriverfrom selenium.common.exceptions import TimeoutException, NoSuchElementException
browser = webdriver.Chrome()try:
    browser.get(&#39;https://www.baidu.com&#39;)except TimeoutException:
    print(&#39;Time Out&#39;)try:
    browser.find_element_by_id(&#39;hello&#39;)except NoSuchElementException:
    print(&#39;No Element&#39;)finally:
    browser.close()

本文讲解了selenium用法，更多相关内容请关注php中文网。

相关推荐：

如何通过CSS3进行2D转换

详解JavaScript的变量及作用域

关于$.ajax()方法参数详解

Atas ialah kandungan terperinci 关于selenium用法的详解. Untuk maklumat lanjut, sila ikut artikel berkaitan lain di laman web China PHP!

Kenyataan

Kandungan artikel ini disumbangkan secara sukarela oleh netizen, dan hak cipta adalah milik pengarang asal. Laman web ini tidak memikul tanggungjawab undang-undang yang sepadan. Jika anda menemui sebarang kandungan yang disyaki plagiarisme atau pelanggaran, sila hubungi admin@php.cn

Artikel Berkaitan

Dari C/C ke JavaScript: Bagaimana semuanya berfungsiApr 14, 2025 am 12:05 AM

Peralihan dari C/C ke JavaScript memerlukan menyesuaikan diri dengan menaip dinamik, pengumpulan sampah dan pengaturcaraan asynchronous. 1) C/C adalah bahasa yang ditaip secara statik yang memerlukan pengurusan memori manual, manakala JavaScript ditaip secara dinamik dan pengumpulan sampah diproses secara automatik. 2) C/C perlu dikumpulkan ke dalam kod mesin, manakala JavaScript adalah bahasa yang ditafsirkan. 3) JavaScript memperkenalkan konsep seperti penutupan, rantaian prototaip dan janji, yang meningkatkan keupayaan pengaturcaraan fleksibiliti dan asynchronous.

Enjin JavaScript: Membandingkan PelaksanaanApr 13, 2025 am 12:05 AM

Enjin JavaScript yang berbeza mempunyai kesan yang berbeza apabila menguraikan dan melaksanakan kod JavaScript, kerana prinsip pelaksanaan dan strategi pengoptimuman setiap enjin berbeza. 1. Analisis leksikal: Menukar kod sumber ke dalam unit leksikal. 2. Analisis Tatabahasa: Menjana pokok sintaks abstrak. 3. Pengoptimuman dan Penyusunan: Menjana kod mesin melalui pengkompil JIT. 4. Jalankan: Jalankan kod mesin. Enjin V8 mengoptimumkan melalui kompilasi segera dan kelas tersembunyi, Spidermonkey menggunakan sistem kesimpulan jenis, menghasilkan prestasi prestasi yang berbeza pada kod yang sama.

Beyond the Browser: JavaScript di dunia nyataApr 12, 2025 am 12:06 AM

Aplikasi JavaScript di dunia nyata termasuk pengaturcaraan sisi pelayan, pembangunan aplikasi mudah alih dan Internet of Things Control: 1. Pengaturcaraan sisi pelayan direalisasikan melalui node.js, sesuai untuk pemprosesan permintaan serentak yang tinggi. 2. Pembangunan aplikasi mudah alih dijalankan melalui reaktnatif dan menyokong penggunaan silang platform. 3. Digunakan untuk kawalan peranti IoT melalui Perpustakaan Johnny-Five, sesuai untuk interaksi perkakasan.

Membina aplikasi SaaS Multi-penyewa dengan Next.js (Integrasi Backend)Apr 11, 2025 am 08:23 AM

Saya membina aplikasi SaaS multi-penyewa berfungsi (aplikasi edTech) dengan alat teknologi harian anda dan anda boleh melakukan perkara yang sama. Pertama, apakah aplikasi SaaS multi-penyewa? Aplikasi SaaS Multi-penyewa membolehkan anda melayani beberapa pelanggan dari Sing

Cara Membina Aplikasi SaaS Multi-Tenant dengan Next.js (Integrasi Frontend)Apr 11, 2025 am 08:22 AM

Artikel ini menunjukkan integrasi frontend dengan backend yang dijamin oleh permit, membina aplikasi edtech SaaS yang berfungsi menggunakan Next.Js. Frontend mengambil kebenaran pengguna untuk mengawal penglihatan UI dan memastikan permintaan API mematuhi dasar peranan

JavaScript: meneroka serba boleh bahasa webApr 11, 2025 am 12:01 AM

JavaScript adalah bahasa utama pembangunan web moden dan digunakan secara meluas untuk kepelbagaian dan fleksibiliti. 1) Pembangunan front-end: Membina laman web dinamik dan aplikasi satu halaman melalui operasi DOM dan kerangka moden (seperti React, Vue.js, sudut). 2) Pembangunan sisi pelayan: Node.js menggunakan model I/O yang tidak menyekat untuk mengendalikan aplikasi konkurensi tinggi dan masa nyata. 3) Pembangunan aplikasi mudah alih dan desktop: Pembangunan silang platform direalisasikan melalui reaktnatif dan elektron untuk meningkatkan kecekapan pembangunan.

Evolusi JavaScript: Trend Semasa dan Prospek Masa DepanApr 10, 2025 am 09:33 AM

Trend terkini dalam JavaScript termasuk kebangkitan TypeScript, populariti kerangka dan perpustakaan moden, dan penerapan webassembly. Prospek masa depan meliputi sistem jenis yang lebih berkuasa, pembangunan JavaScript, pengembangan kecerdasan buatan dan pembelajaran mesin, dan potensi pengkomputeran IoT dan kelebihan.

Demystifying JavaScript: Apa yang berlaku dan mengapa pentingApr 09, 2025 am 12:07 AM

JavaScript adalah asas kepada pembangunan web moden, dan fungsi utamanya termasuk pengaturcaraan yang didorong oleh peristiwa, penjanaan kandungan dinamik dan pengaturcaraan tak segerak. 1) Pengaturcaraan yang didorong oleh peristiwa membolehkan laman web berubah secara dinamik mengikut operasi pengguna. 2) Penjanaan kandungan dinamik membolehkan kandungan halaman diselaraskan mengikut syarat. 3) Pengaturcaraan Asynchronous memastikan bahawa antara muka pengguna tidak disekat. JavaScript digunakan secara meluas dalam interaksi web, aplikasi satu halaman dan pembangunan sisi pelayan, sangat meningkatkan fleksibiliti pengalaman pengguna dan pembangunan silang platform.

See all articles