本文实例讲述了Pythonselenium的基本使用方法。分享给大家供大家参考,具体如下:selenium是
本文实例讲述了Python selenium的基本使用方法。分享给大家供大家参考,具体如下:
selenium是一个web自动化测试工具,selenium可以直接运行在浏览器上,可以接收指令,让浏览器自动加载页面,获取需要的数据。
selenium的基本使用
1.导包
from selenium import webdriver
2.创建driver对象
webdriver.PhantomJS()
3.请求数据
driver.get("http://www.baidu.com")
4.查看网页源码
driver.page_source
5.关闭无界面浏览器
driver.quit()
6.根据id定位元素
drivrt.find_element_by_id("kw")
7.操作点击事件
click()
8.给输入框赋值
send_keys()
selenium的定位操作
定位元素语法:
find_element_by_id(返回一个元素) find_elements_by_xpath(返回一个包含元素的列表) find_elements_by_link_text(根据连接文本获取元素列表) find_elements_by_partial_link_text(根据链接包含的文本获取元素列表) find_elements_by_tag_name(根据标签名获取元素列表) find_elements_bu_class_name(根据类名获取元素列表)
注意
find_element和find_elements的区别:多了个s返回列表,没有s的返回匹配到的第一个。
获取数据
获取文本:element.text
获取属性值:element.get_attribute("href")
selenium的其他方法
selenium处理cookie
driver.get_cookies()
,获取的是完整的cookie信息,不光有name、value,还有domain等其他信息。
# 把cookie转换为字典
cookies_dict = {cookie['name']: cookie['value'] for cookie in driver.get_cookies()}
# 删除一条cookie
driver.delete_cookie("CookieName")
# 删除所有cookie
driver.delete_all_cookies()
页面等待
time.sleep(10)
selenium执行js代码
driver.execute_script('js语句')
switch方法切换的操作
1.窗口切换
# 获取当前所有的窗口
current_windows = driver.window_handles
# 根据窗口索引进行切换
driver.switch_to.window(current_windows[1])
2.selenium默认访问不了frame中的内容,对应解决的方法是driver.switch_to.frame()
3.处理页面弹窗提示
driver.switch_to.alert()
页面前进和后退
driver.forward() # 前进
driver.back(() # 后退
selenium的优缺点
- 优点:selenium能够执行页面上的js,对于js渲染的数据和模拟登陆处理起来较容易。
- 缺点:selenium由于在获取页面过程会发送很多请求,所以效率非常低。