Selenium的三种等待

当执行python的selenium代码时,如果需要定位一个元素或者点击一个元素,需要考虑到网速等多方面原因,导致页面加载速度慢,元素还未加载出来,这样就会导致找不到对应元素,从而报错的问题,所以要设置等待条件,等待元素加载出来后才执行相应的代码。

其中,selenium中有三种等待方式,下面一一进行介绍

  • sleep(): 强制等待,设置固定休眠时间。后脚本的执行过程中执行 sleep()后线程休眠,而另外两种线程不休眠。
  • implicitly_wait():隐式等待,是设置的全局等待。设置等待时间,是对页面中的所有元素设置加载时间,如果超出了设置时间的则抛出异常。隐式等待可以理解成在规定的时间范围内,浏览器在不停的刷新页面,直到找到相关元素或者时间结束。
  • WebDriverWait():显示等待,是针对于某个特定的元素设置的等待时间,在设置时间内,默认每隔一段时间检测一次当前页面某个元素是否存在,如果在规定的时间内找到了元素,则直接执行,即找到元素就执行相关操作,如果超过设置时间检测不到则抛出异常。默认检测频率为0.5s,默认抛出异常为:NoSuchElementException。
  • 显示等待和隐士等待同时存在时,看谁的时间长,就取谁的等待时间

    一、强制等待

    最简单的一种方式,直接引入time模块,设置等待时间,但这种方式实用性不高,设置时间太短元素仍未找到,设置时间过长影响效率。

    import time
    time.sleep(5)#强制等待5s
    

    二、隐形等待

    由webdriver提供的方法,一旦设置,这个隐式等待会在WebDriver对象实例的整个生命周期起作用,它不针对某一个元素,是全局元素等待,即在定位元素时,需要等待页面全部元素加载完成,才会执行下一个语句。如果超出了设置时间的则抛出异常。

    当一个元素初始化后,养成习惯进行隐式等待,相当于监控器
    在窗口切换后不再生效

    局限性高,只能用来等元素出现,或者是某个指令没有完成,并不能等待所有情况,只能等待很少的一部分。
    当页面某些js无法加载,但是想找的元素已经出来了,它还是会继续等待,直到页面加载完成(浏览器标签左上角圈圈不再转),才会执行下一句。某些情况下会影响脚本执行速度。

    from selenium.webdriver import Chrome
    browser = Chrome() # 浏览器对象
    # 开启隐式等待,全局只需放一次
    browser.implicitly_wait(30)
    browser.implicitly_wait(10)  # 等待十秒加载不出来就会抛出异常,10秒内加载出来正常返回
    browser.get('http://www.baidu.com')
    e = browser.find_element_by_id('kw')
    print(e)
    

    implicity_wait()默认参数的单位为秒,本例中设置等待时长为10秒,首先这10秒并非一个固定的等待时间,它并不影响脚本的执行速度。其次,它并不针对页面上的某一元素进行等待。当脚本执行到某个元素定位时,如果元素可以定位,则继续执行,如果元素定位不到,则它将以轮询的方式不断地判断元素是否被定位到。假设在第六秒定位到了元素则继续执行,若直到超出设置的时长10秒还没有定位到元素,则抛出异常。

    三、显性等待

    原理:指定一个等待条件,和一个最长等待时间,程序会判断在等待时间内条件是否满足,如果满足则返回,如果不满足会继续等待,超过时间就会抛出异常。

    (简而言之,就是直到元素出现才去操作,如果超时则报异常)

    需要通过from selenium.webdriver.support.wait import WebDriverWait导入模块

    from selenium.webdriver import Chrome
    from selenium.webdriver.support.wait import WebDriverWait
    from selenium.webdriver.common.by import By
    from selenium.webdriver.support import expected_conditions as EC
    browser = Chrome() # 浏览器对象
    browser.get('http://www.baidu.com') # 访问百度页面
    e = browser.find_element_by_id('kw')#webelement对象
    # 发送数据,输入文本
    e.send_keys('腾讯课堂')
    # 快速点击,查找父节点如果有form表单就会直接提交
    e.submit()
    #定时器、等待器
    wait = WebDriverWait(browser, 20)
    #等待条件,直到元素可见,传入条件为元祖格式
    e = wait.until(EC.visibility_of_element_located((By.XPATH, "//a[contains(text(), 'ke.qq.com/' )]")))
    #e = wait.until(EC.visibility_of_element_located(("xpath", "//a[contains(text(), 'ke.qq.com/' )]")))
    e = browser.find_element_by_xpath("//a[contains(text(), 'ke.qq.com/' )]")
    print(e)
    

    WebDriverWait(driver,timeout,poll_frequency=0.5,ignored_exceptions=None)

    driver:浏览器驱动

    timeout:最长超过时间,默认以秒为单位

    poll_frequency:监测的时间间隔,默认为0.5秒

    ignored_exceptions:超时后的异常信息,默认情况下抛NoSuchElementException异常

    WebDriverWait一般与until和until_not方法配合使用

    until(method,message)

    until_not(method ,message)

    3.1 WebDriverWait与expected_conditions结合使用

    expected_conditions类常用的判断方法有:

  • title_is:标题时某个内容
  • title_contains:标题包含某内容
  • presence_of_element_located----(2)元素加载出,传入定位元组,如(By.ID, 'p')
  • visibility_of_element_located----(1)元素可见,传入定位元组
  • visibility_of:可见,传入元素对象
  • presence_of_all_elements_located:所有元素加载出
  • text_to_be_present_in_element:某个元素文本包含某文字
  • text_to_be_present_in_element_value:某个元素值包含某文字
  • frame_to_be_available_and_switch_to_it:frame加载并切换
  • invisibility_of_element_located:元素不可见
  • element_to_be_clickable ----(3)元素可点击
  • staleness_of:
  • element_to_be_selected:
  • element_located_to_be_selected
  • element_selection_state_to_be
  • element_located_selection_state_to_be
  • alert_is_present
  • 3.2 自行定义等待器

    工作中根据webdriverwait原理,自行封装,不需要管这个判断条件,但在学习期间不建议使用自行封装

    def wait_element(drive,timeout,poll,locator):
    	#locator=("xpath","//....")
        time_use=0
        while time_use<timeout:
                e=driver.find_element(*locator)#拆包
                return e
            except:
            	time.sleep(poll)
            	time_use+= poll
        raise TimeoutError("元素定位超时")