1、在Windows设置临时环境变量cmd命令窗口输入path=%path%;E:\soft\python-3.5.2-embed-win32永久配置,在
1、在 Windows 设置临时环境变量 cmd命令窗口 输入 path=%path%;E:\soft\python-3.5.2-embed-win32
永久配置,在系统变量下找到path,在Path的最后面添加Python的安装目录
D:\Python34,同样在PATHEXT中添加 .PY;.PYM
然后,输入python 出现版本信息就成功了。
2、CMD命令窗口,清屏的方法
import os
os.system('cls')
如果不要返回值0就是:
import os
i=os.system('cls')
3、查看当前系统时间
import time
#-*-格式时间格式-*-
localtime = time.asctime( time.localtime(time.time()) )
#-*-格式时间格式[格式化成2009-03-20 11:45:39形式]-*-
time.strftime("%Y-%m-%d %H:%M:%S", time.localtime())
#-*-格式时间格式[时间戳格式]-*-
time.strftime("%a %b %d %H:%M:%S %Y", time.localtime())
#-*-输出格式化后的时间-*-
print ("本地时间为 :", localtime)
4、在CMD命令行中,输入 “python” + “空格”,即 ”python “;将已经写好的脚本文件拖拽到当前光标位置,然后敲回车运行即可
5、乱码原因:
因为你的文件声明为utf-8,并且也应该是用utf-8的编码保存的源文件。但是windows的本地默认编码是cp936,也就是gbk编码,所以在控制台
直接打印utf-8的字符串当然是乱码了。
解决方法:
在控制台打印的地方用一个转码就ok了,打印的时候这么写:
print myname.decode('UTF-8').encode('GBK')
比较通用的方法应该是:
import sys
type = sys.getfilesystemencoding()
print myname.decode('UTF-8').encode(type)
#-*-coding:UTF-8-*- 或者 import sys
reload(sys)
sys.setdefaultencoding('UTF-8')
6、其实要驱动chrome浏览器必须要依赖Chromedriver文件才行,
下载地址:
http://code.google.com/p/chromedriver/downloads/list
找到适合你自己系统的包之后下载解压出Chromedriver文件,并将此文件拷贝到java项目的根目录。还是拿上此教程的为例,我们直接爸chromedriver文件拷贝到HelloSelenium项目的根目录下也就是HelloSelenium目录下。这样就可以直接运行了。
7、 安装pyse : 将其克隆到本地,将pyse目录放到..\Python27\Lib\site-packages\目录下。
https://github.com/defnngj/pyse
python setup.py install 安装
java -jar selenium-server-standalone-3.4.0.jar -multiWindow
8、定位属性
#########百度输入框的定位方式##########
#通过id方式定位
browser.find_element_by_id("kw").send_keys("selenium")
#通过name方式定位
browser.find_element_by_name("wd").send_keys("selenium")
#通过tag name方式定位
browser.find_element_by_tag_name("input").send_keys("selenium")
#通过class name 方式定位
browser.find_element_by_class_name("s_ipt").send_keys("selenium")
#通过CSS方式定位
browser.find_element_by_css_selector("#kw").send_keys("selenium")
#通过xphan方式定位
browser.find_element_by_xpath("//input[@id='kw']").send_keys("selenium")
############################################
browser.find_element_by_id("su").click()
time.sleep(3)
browser.quit()
一、元素的定位
1.webdriver提供的8种页面元素定位方法:
id/name/class name/tag name/link text/partial link text/xpath/css selector
其中python对应的8种方法:
find_element_by_id() 如: find_element_by_id("kw")
find_element_by_name() 如: find_element_by_name("wd")
find_element_by_class_name() 如: find_element_by_class_name("s_ipt")
find_element_by_tag_name() 如: find_element_by_tag_name("input")
find_element_by_link_text() 如:find_element_by_link_text(u"新闻")
find_element_by_partial_link_text() 如:find_element_by_partial_link_text(u"一个很长的")
find_element_by_xpath() 如: find_element_by_xpath(" .//*[@id='kw']")
find_element_by_css_selector() 如: find_element_by_css_selector("#kw")
二、浏览器控制
1.控制浏览器大小:
set_window_size() 例如:driver.set_window_size(400,500)
maximize_window() 例如:driver.maximize_window() #无参数
2.浏览器后退、前进:back()-后退、farward()-前进
三、鼠标事件
ActionChains类提供的常用方法:
1.1 perform():执行ActionChains中存储的所有行为,对整个事件进行提交
1.2 context_click(): 右击
如:
from selenium.webdriver.common.action_chains import ActionChains
...
ActionChains(dr).context_click(docfile).perform()
1.3 double_click(): 双击
如:
from selenium.webdriver.common.action_chains import ActionChains
...
doubleClick=dr.find_element_by_id("xxx")
ActionChains(dr). double_Click(doubleClick).perform()
1.4 drag_and_drop(source,target): 拖动
如:
from selenium.webdriver.common.action_chains import ActionChains
...
dsource=dr.find_element_by_id("xxx") #拖动的源元素
dtarget=dr.find_element_by_id("xxx") #释放的目标目标元素
ActionChains(dr).drag_and_drop(dsource,dtarget).perform()
1.5 move_to_element(): 鼠标悬停
如:
from selenium.webdriver.common.action_chains import ActionChains
...
above=dr.find_element_by_id("xxx")
ActionChains(dr).move_to_element(above).perform()
四、键盘事件
1.首先要导入键盘事件的包
from selenium.webdriver.common.keys importKeys
...
dr.get("http://www.baidu.com")
#输入内容
dr.find_element_by_id("kw").send_keys("seleniumm")
#删除输入内容的最后一个字母,
dr.find_element_by_id("kw").send_keys(Keys.BACK_SPACE)
#输入:空格+教程
dr.find_element_by_id("kw").send_keys(Keys.SPACE)
dr.find_element_by_id("kw").send_keys(u"教程")
#ctrl+a全选输入框内容
dr.find_element_by_id("kw").send_keys(Keys.CONTROL,'a')
#ctrl+x剪贴输入框内容
dr.find_element_by_id("kw").send_keys(Keys.CONTROL,'x')
#ctrl+v剪贴输入框内容
dr.find_element_by_id("kw").send_keys(Keys.CONTROL,'v')
#回车键操作
dr.find_element_by_id("su").send_keys(Keys.ENTER)
dr.close()
常用的键盘操作整理:
send_keys(Keys.BACK_SPACE) #删除键BackSpace
send_keys(Keys.SPACE) #空格键Space
send_keys(Keys.TAB) #制表键Tab
send_keys(Keys.ESCAPE) #回退键Esc
send_keys(Keys.ENTER) #回车键Enter
send_keys(Keys.CONTROL,'a') #Ctrl+a
send_keys(Keys.CONTROL,'c') #Ctrl+c
send_keys(Keys.CONTROL,'x') #Ctrl+x
send_keys(Keys.CONTROL,'v') #Ctrl+x
send_keys(Keys.F1) #F1,类似的有F1-F12
五、获取验证
六、设置等待
1.显示等待:等待某个条件成立时,继续执行,否则达到最大等待时间后抛出异常:TimeoutException,显示等待是针对当前要定位元素使用
WebDriverWait(driver, timeout,poll_frequency,ignored_exceptions=None).until(method,message)
示例:
WebDriverWait(dr,5,0.5,None).until(
expected_conditions.presence_of_element_located((By.ID,"kw1")),message='test')
解释:
A.WebDriverWait():在设置时间内,默认间隔一段时间检测一次当前页面元素是否存在,若超过当前指定时间检测不到则抛出异常;
B.driver:webdriver的浏览器驱动,ie、firefox、chromea
C.timeout:最长超时时间,以秒为单位
D.poll_frequency:休眠间隔时间-步长,默认0.5秒
E.ignored_exceptions:超时后异常信息,默认抛出NoSuchElementException异常
F.until(method,message): 调用该方法提供的驱动作为一个参数,直到返回值为True
G.until_not(method,message):调用该方法提供的驱动作为一个参数,直到返回值为False
H.expected_conditions类提供的预期条件实现有:
title_is:判断标题是否是xx
title_contains:判断标题是否包含xx
presence_of_element_located:元素是否存在
visibility_of_element_located:元素是否存在
visibility_of:是否可见
presence_of_all_elements_located:判断一组元素是否存在
text_to_be_present_in_element:判断元素是否有xx文本信息
text_to_be_present_in_element_value:判断元素值是否有xx文本信息
frame_to_be_available_and_switch_to_it:表单是否可见,并切换到该表单
invisibility_of_element_located:判断元素是否隐藏
element_to_be_clickable:判断元素是否点击,它处于可见和启动状态
staleness_of:等到一个元素不再依附于DOM
element_to_be_selected:被选中的元素
element_located_to_be_selected:一个期望的元素位于被选中
element_selection_state_to_be:一个期望检查如果给定元素被选中
element_located_selection_state_to_be:期望找到一个元素并检查是否是选择状态
alert_is_present:预期一个警告信息
2.隐式等待:通过一定的时长等待页面所有元素加载完成,哪个元素超出设置时长没被加载就抛出异常NoSuchElementException,隐式等待是针对所有元素的
implicitly_wait(5) #默认单位为秒
示例:
dr.implicitly_wait(5)
七、sleep休眠 python中强制的程序等待
from time import sleep
sleep(4) #默认单位秒,设置小于1秒的时间可以用小数点如sleep(0.6)
八、定位一组元素,类似与1中定位单个元素方法
find_elements_by_id() 如: find_elements_by_id("kw")
find_elements_by_name() 如: find_elements_by_name("wd")
find_elements_by_class_name() 如: find_elements_by_class_name("s_ipt")
find_elements_by_tag_name() 如: find_elements_by_tag_name("input")
find_elements_by_link_text() 如:find_elements_by_link_text(u"新闻")
find_elements_by_partial_link_text() 如:find_elements_by_partial_link_text(u"一个很长的")
find_elements_by_xpath() 如: find_elements_by_xpath(" .//*[@id='kw']")
find_elements_by_css_selector() 如: find_elements_by_css_selector("#kw")
使用场景:
a.批量操作对象,如选中页面上所有复选框
b.先获取一组对象,再在这组对象里定位需要的的一些对象,如定位所有复选框,然后选择最后一个
例如:代码如下
checkbox.htm页面:
<styletype="text/css">
body{font-size:12px; font-family:Tahoma;}
.checkbox{vertical-align:middle; margin-top:0;}
</style>
<body>
<inputclass="checkbox"type="checkbox"/>元旦
<inputtype="checkbox"name="test"/>圣诞节
<inputtype="checkbox"name="test"/>股市
<inputtype="checkbox"name="test"/>阿凡达
<inputtype="checkbox"name="test"/>十月围城
<inputtype="checkbox"name="test"/>水价上调
<inputtype="button"value="检测"id="btn"/>
</body>
python代码:
from selenium import webdriver
dr=webdriver.Firefox()
dr.get("D:\\workspace\\pySelenium\\resources\\checkbox.htm")
#使用tagname方式选择页面上所有tagname为input的元素
select_tagname=dr.find_elements_by_tag_name("input")
#使用xpath方式选择页面上所有tagname为input的元素
select_xpath=dr.find_elements_by_xpath("//input[@type='checkbox']")
#使用css_select方式选择页面上所有tagname为input的元素
select_css=dr.find_elements_by_css_selector('input[type=checkbox]')
for i in select_tagname:
#循环对每个input元素进行点击选中操作
if i.get_attribute("type")=='checkbox':
i.click()
for j in select_xpath:
#循环对每个input元素进行点击取消操作
j.click()
for k in select_css:
#循环对每个input元素进行点击选中操作
k.click()
#打印出checkbox的个数
print'----页面上checkbox的个数为:',len(select_css)
#使用pop()获取1组元素的第几个元素
select_css.pop(0).click()#第一个
select_css.pop(1).click()#第二个
select_css.pop().click()#最后一个
select_css.pop(-1).click()#最后一个
select_css.pop(-2).click()#倒数第二个
dr.close()
备注:pop():选择一组元素中的某一个,要注意的是:pop()和pop(-1)都表示最后一个元素
九、多表单切换(对于有frame嵌套表单的操作)
frame页面:
<html>
<body>
<frameset>
<h3>frame</h3>
<iframeid='frameid'name='frameName'width="800"height="500"src="http://www.baidu.com"/>
</frameset>
</body>
</html>
python代码:
dr.get("D:\\workspace\\pySelenium\\resources\\frame.htm")
dr.switch_to_frame("frameid")#通过frame的id进入iframe
#dr.switch_to_frame("frameName") #通过frame的name进入iframe
#下面可以对frame进行操作了
dr.find_element_by_id("kw").send_keys("selenium")
dr.find_element_by_id("su").click()
dr.switch_to_default_content()#退出当前frame返回上一层
备注:
1.switch_to_frame()默认直接取表单的id或者name属性来切换
2.完成当前frame表单操作后,可以通过switch_to_default_content()方法返回上一层表单,即离的最近的switch_to_frame()方法
3.对于frame中没有id和name属性的通过下面方式进入frame(定位到frame以页面对象传入)
python代码:
dr.get("D:\\workspace\\pySelenium\\resources\\frame.htm")
#定位到frame页面元素
framepath=dr.find_element_by_class_name("frameClassname")
dr.switch_to_frame(framepath)#通过frame页面对象进入iframe
#下面可以对frame进行操作了
dr.find_element_by_id("kw").send_keys("selenium")
dr.find_element_by_id("su").click()
dr.switch_to_default_content()#退出当前frame返回上一层
十、多窗口切换
selenium-webdriver中使用switch_to_window()方法来切换任意窗口,常用方法有
driver.current_window_handle #获取当前窗口句柄
driver.window_handles #返回所有窗口句柄到当前会话
driver.switch_to_window() #进入窗口,用于切换不同窗口
python代码:
dr.get("http://www.baidu.com")
current_handle=dr.current_window_handle #获取百度首页窗口句柄
index_login=dr.find_element_by_xpath("//div[@id='u1']/a[@class='lb']")#获取登录按钮对象
index_login.click()#点击登录
dr.implicitly_wait(5)
dr.find_element_by_class_name("pass-reglink").click()#点击立即注册按钮
all_handles=dr.window_handles #获取所有打开窗口句柄
for handle in all_handles:
if handle==current_handle:
dr.switch_to_window(handle)
'''
...对首页窗口进行操作
'''
print'----首页页面title:',dr.title
for handle in all_handles:
if handle!=current_handle:
dr.switch_to_window(handle)
'''
...对注册窗口进行操作
'''
print'----注册页面title:',dr.title
十一、警告框处理
webdriver中处理js生成的alert、confirm、prompt处理方法是:使用switch_to_alert()定位到alert/confirm/prompt,然后使用text、accept、dismiss、send_keys来根据需要操作。
text:返回alert、confirm、prompt中的文字信息
accept:点击确认按钮
dismiss:点击取消按钮
send_keys:在alert、confirm有对话框时输入值
python代码:
dr.get("http://www.baidu.com")
set_link=dr.find_element_by_xpath("//div[@id='u1']/a[@class='pf']")#找到设置链接元素
ActionChains(dr).move_to_element(set_link).perform()#鼠标移动到设置上
dr.find_element_by_xpath("//a[@class='setpref']").click()#点击搜索设置链接
time.sleep(3) #加等待时间 等按钮可用,否则会报错
save_set=dr.find_element_by_css_selector("#gxszButton > a.prefpanelgo")#获取保存设置按钮
save_set.click()#点击保存设置按钮
alert=dr.switch_to_alert() #进入alert
print'----弹出alert中内容为:',alert.text #打印对话框里的文字内容
alert.accept()#对话框里点击alert中确定按钮
#alert.dismiss() #对话框里点击取消按钮
#alert.send_keys("对话框中输入的内容") #在对话框里输入内容
十二、上传文件
分2种:普通上传、插件上传
普通上传:将本地文件的路径作为一个值放到input标签中,通过form表单提交时,将值传给服务器中去
插件上传:指基于flash、javascript或ajax技术实现的上传功能或插件。
1.针对普通上传用send_keys实现
python代码:
dr.get("D:\\workspace\\pySelenium\\resources\\upload.htm")
loadFile=dr.find_element_by_name("filebutton")# 获取上传文件input元素节点
loadFile.send_keys("D:\\workspace\\pySelenium\\resources\\frame.htm")#输入上传文件地址来实现上传
2.插件上传:使用AutoIt实现,--需要安装AutoIt程序
AutoIt安装,使用暂时略,需要时再追加,流程为:用AutoIt编写上传文件脚本生成exe文件,在python脚本中进行调用
python代码:
loadFile=dr.find_element_by_name("filebutton")# 获取上传按钮
loadFile.click() #点击上传按钮,弹出上传对话框
os.system("D:\\autoItFile.exe") #调用autoIt生成的exe文件,实现导入
十三、下载文件:使用AutoIt实现,--需要安装AutoIt程序,方法同上传
python代码:
ffp=webdriver.FirefoxProfile()
ffp.set_preference("browser.download.folderList",2)#0:代表下载到浏览器默认路径下;2:下载到指定目录
ffp.set_preference("browser.download.manager.showWhenStarting",False)#是否显示开始:True:显示;False:不显示
ffp.set_preference("browser.download.dir", os.getcwd())#指定下载文件目录,os.getcwd()无参数,返回当前目录
# ffp.set_preference("browser.helperApps.neverAsk.saveToDisk","application/octet-stream")#下载文件类型,
#指定下载页面的content-type值,application/octet-stream为文件类型,http-content-type常用对照表搜索百度
dr=webdriver.Firefox(firefox_profile=ffp)
dr.get("https://pypi.python.org/pypi/selenium#downloads")
dr.find_element_by_xpath("//div[@id='content']/div[3]/table/tbody/tr[3]/td[1]/span/a[1]").click()
#接下来使用autoIt实现
十四、cookies操作
webdriver操作cookies的方法:
get_cookies():获得所有cookies的值
get_cookie(name):获得有特定name值的cookie信息
add_cookie(cookie_dict):添加cookie,必须有name和value
delete_cookie(name):删除特定名称的cookie信息,通过name找到特定的cookie并删除
delete_all_cookies():删除浏览器中所有cookie的信息
注意:
1.cookie是以字典形式进行存储的;
2.使用场景:如登录功能会把用户名写入浏览器cookie指定key为username,那么就可以通过get_cookies()找到username,打印value,找不到说明保存浏览器的cookie是有bug的。
python代码:
num=1
dr.get("http://www.baidu.com")
cookies=dr.get_cookies()#获取cookie的所有信息
for ck in cookies:
print'----所有cookie',num,':',ck #打印cookie的所有信息
num=num+1
print'----按name查cookie:',dr.get_cookie("PSTM")#通过cookie的name获取cookie信息
dr.add_cookie({'name':'hello','value':'123456789'})#向name和value添加会话信息
cookies2=dr.get_cookies()#重新获取cookie的所有信息
for ck2 in cookies2:
if ck2['name']=='hello':
print"----加入的cookie信息:%s-->%s",(ck2['name'],ck2['value'])
十五、javascript调用,python使用的方法:execute_script()
python代码:
dr.get("http://www.baidu.com")
dr.find_element_by_id("kw").send_keys("selenium")
dr.find_element_by_id("su").click()
js="var q=document.documentElement.scrollTop=1000" #滚动条滚到最下面
dr.execute_script(js)
time.sleep(4)
js2="var q=document.documentElement.scrollTop=0" #滚动条滚到页面顶
dr.execute_script(js2)
十六、截图,适用于脚本出错时,对当前窗口进行截图保存,使用函数:get_screenshot_as_file()
python代码:
dr.get("http://www.baidu.com")
try:
dr.find_element_by_id("kw1").send_keys("selenium")
dr.find_element_by_id("su").click()
exceptNoSuchElementException,msg:
dr.get_screenshot_as_file("d:\\error.jpg") #截图输出到d盘
print msg
dr.close()
十七、关闭窗口
quit():退出相关驱动程序并关闭所有窗口。
close():关闭当前窗口,打给多个窗口时,可使用来关闭当前窗口
十八、验证码处理
方法1:去掉验证码,问题:如果是在正式环境跑脚本那么在取掉会存在风险
方法2:设置万能验证码,不需要取消验证码,在程序中留后门--设置一个万能验证码,输入万能验证码了就标识通过
python代码:
import random
randnum=random.randint(1000,9999)
print"----生成随机数为:",randnum
input_num=input(u"请输入验证码:")
print"----输入验证码为:",input_num
if input_num==randnum:
print"随机数正确,登录成功"
elif input_num==1234:
print"输入正确,登录成功"
else:
print"登录失败"
方法3:使用cookie方法获取,读取之前登录的cookie值访问时,直接登录,不需要验证码
--------------------------------------------------- CMD -----------命令启动Python脚本
文件命名为:test.bat 貌似不能用
@echo off
echo.
python E:\pythonScript\Auto_linknetwork.py
cd /D C:\Python27
python.exe
rm #!C:\Python27/python.exe
import os;
i=os.system("清屏",cls);
import time;
#-*-格式时间格式[格式化成2009-03-20 11:45:39形式]-*-
time.strftime("%Y-%m-%d %H:%M:%S", time.localtime());
print ("系统当前时间为 :", localtime);
1、截屏
driver.save_screenshot('E:\\pythonScript\\images\\'+strTime+'baidu.png')
三. WebElement接口获取值
通过WebElement接口可以获取常用的值,这些值同样非常重要。 size 获取元素的尺寸
text 获取元素的文本
get_attribute(name) 获取属性值
location 获取元素坐标,先找到要获取的元素,再调用该方法
page_source 返回页面源码
driver.title 返回页面标题
current_url 获取当前页面的URL
is_displayed() 设置该元素是否可见
is_enabled() 判断元素是否被使用
is_selected() 判断元素是否被选中
tag_name 返回元素的tagName
四.得到函数中的返回值
函数()
def returnval():
driver = webdriver.Chrome()
print u"\n回传值"
return driver
#returnval()
src = ("http://hos.sf-express.com")
returnval().get(src)
print returnval()
将函数作为返回值返回,不返回结果只返回函数
def lazy_sum(*args):
def sum():
ax = 0
for n in args:
ax = ax + n
return ax
return sum
>> f = lazy_sum(1, 3, 2, 7, 9)
>> f
>> f()
#此时才是真正的计算出函数值;
新建实例driver = webdriver.Chrome()
1.获取当前页面的Url函数
方法:current_url
实例:
driver.current_url
2.获取元素坐标
方法:location
解释:首先查找到你要获取元素的,然后调用location方法
实例:
driver.find_element_by_xpath("//*[@id='tablechart']/tbody/tr[14]/td[9]").location
3.表单的提交
方法:submit
解释:查找到表单(from)直接调用submit即可
实例:
driver.find_element_by_id("form1").submit()
4.获取CSS的属性值
方法:value_of_css_property(css_name)
实例:
driver.find_element_by_css_selector("input.btn").value_of_css_property("input.btn")
5.获取元素的属性值
方法:get_attribute(element_name)
实例:
driver.find_element_by_id("sellaiyuan").get_attribute("sellaiyuan")
6.判断元素是否被选中
方法:is_selected()
实例:
driver.find_element_by_id("form1").is_selected()
7.返回元素的大小
方法:size
实例:
driver.find_element_by_id("iptPassword").size
返回值:{'width': 250, 'height': 30}
8.判断元素是否显示
方法:is_displayed()
实例:
driver.find_element_by_id("iptPassword").is_displayed()
9.判断元素是否被使用
方法:is_enabled()
实例:
driver.find_element_by_id("iptPassword").is_enabled()
10.获取元素的文本值
方法:text
实例:driver.find_element_by_id("iptUsername").text
11.元素赋值
方法:send_keys(*values)
实例:
driver.find_element_by_id("iptUsername").send_keys('admin')
注意如果是函数需要增加转义符u,eg.
driver.find_element_by_id("iptUsername").send_keys(u'青春')
12.返回元素的tagName
方法:tag_name
实例:
driver.find_element_by_id("iptUsername").tag_name
13.删除浏览器所以的cookies
方法:delete_all_cookies()
实例:
driver.delete_all_cookies()
14.删除指定的cookie
方法:delete_cookie(name)
实例:deriver.delete_cookie("my_cookie_name")
15.关闭浏览器
方法:close()
实例:driver.close()
16.关闭浏览器并且推出驱动程序
方法:quit()
实例:driver.quit()
17.返回上一页
方法:back()
实例:driver.back()
18.设置等待超时
方法:implicitly_wait(wait_time)
实例:driver.implicitly_wait(30)
19.浏览器窗口最大化
方法:maximize_window()
实例:driver.maximize_window()
20.查看浏览器的名字
方法:name
实例:drvier.name
以上这篇关于Python 常用获取元素 Driver 总结就是小编分享给大家的全部内容了,希望能给大家一个参考,也希望大家多多支持脚本之家。
Python 元素 Driver