Python selenium破解腾讯滑块验证码，Github开源项目分析

相关文章推荐
坏坏的煎饼果子 · 官方：马竞签下亚特兰大后卫鲁杰里；据悉总价2 ...· 4 月前 ·
沉着的斑马 · 上方山的古树名木_古都风韵_首都之窗_北京市 ...· 7 月前 ·
高大的蟠桃 · Pocket2三轴云台稳定器评测，一键变焦+ ...· 1 年前 ·
爱逃课的凉茶 · 吐血推荐 | ...· 1 年前 ·
善良的回锅肉 · 年报点评24｜华侨城A：业绩由盈转亏，积极推 ...· 2 年前 ·
最近一直在搞滑块验证码，发现它比之前的极验验证码又提升了一个档次。验证码只提供两张拼图，不提供原图。所以通过对比两张图片来寻找缺口的方法已经不适用了！所以要用一些图像处理和计算机视觉相关的方法，比如openCV。但是这个东西太深奥了，又和python的另一个第三方库：numpy紧密结合，所以一时半会是学不完的。咱毕竟是搞数据的又不是搞图像的，我就在git上找了一些大佬的项目，然后拿过来分析一下，做了下简单的修改，加了一些注释。测试了一下，除了个别几张图片，大多还是能正确识别的。
Github链接----<<<<
文件名login，类名Tencent
from selenium.webdriver.support import expected_conditions as EC 
from selenium.webdriver.support.wait import WebDriverWait
from selenium.webdriver.common.by import By
from selenium.webdriver import ActionChains
from selenium import webdriver
import cv2 as cv
import requests
import random
import time
安装第三方库openCV：pip install opencv-python

    def __init__(self, url, username, password):
        初始化浏览器配置，声明变量
        :param url: 要登录的网站地址
        :param username: 账号
        :param password: 密码
        # profile = webdriver.FirefoxOptions()  # 配置无头
        # profile.add_argument('-headless')
        self.browser = webdriver.Chrome()
        self.wait = WebDriverWait(self.browser, 20)
        self.url = url  # 目标url
        self.username = username  # 用户名
        self.password = password  # 密码
注释掉的代码是大佬的，因为我要看一下滑块滑动的过程，所以没有配置无头模式。
程序退出后的操作
    def end(self):
        结束后退出，可选
        :return:
        self.browser.quit()
大佬没有写析构函数，大概是因为end()可选吧
填写个人信息
    def set_info(self):
        填写个人信息，在子类中完成
这个是我后面加上去的，通过后期子类的继承，可以定制不同网站的登录。感觉在父类里面写的话太乱了，于是写个空的放在这里。

(强迫症)
    @staticmethod
    def save_img(bk_block):
        :param bk_block: 图片url
        :return: bool类型，是否被保存
            img = requests.get(bk_block).content
            with open('bg.jpeg', 'wb') as f:
                f.write(img)
            return True
        except:
            return False
@staticmethod
    def get_pos():
        注意：网页上显示的图片为缩放图片，缩放 50% 所以识别坐标需要 0.5
        :return: 缺口位置
        image = cv.imread('bg.jpeg')
        # 高斯滤波
        blurred = cv.GaussianBlur(image, (5, 5), 0)
        # 边缘检测
        canny = cv.Canny(blurred, 200, 400)
        # 轮廓检测
        contours, hierarchy = cv.findContours(
            canny, cv.RETR_EXTERNAL, cv.CHAIN_APPROX_SIMPLE)
        for i, contour in enumerate(contours):
            m = cv.moments(contour)
            if m['m00'] == 0:
                cx = cy = 0
            else:
                cx, cy = m['m10'] / m['m00'], m['m01'] / m['m00']
            if 6000 < cv.contourArea(contour) < 8000 and 370 < cv.arcLength(contour, True) < 390:
                if cx < 400:
                    continue
                x, y, w, h = cv.boundingRect(contour)  # 外接矩形
                cv.rectangle(image, (x, y), (x + w, y + h), (0, 0, 255), 2)
                # cv.imshow('image', image)  # 显示识别结果
                print('【缺口识别】 {x}px'.format(x=x / 2))
                return x / 2
        return 0
重点难点来了，openCV的高级应用。边缘检测和轮廓检测看似简单，但其中的参数很难把控，到了下面的for循环，我就晕了，大概就是找出轮廓的具体位置。

关于openCV目前我是不会再研究下去了，感兴趣的朋友可以看看CSDN上的一个大佬的博客专栏：分享链接----<<<<
模拟滑块轨迹
    @staticmethod
    def get_track(distance):
        :param distance: 距缺口的距离
        :return: 位移列表
        distance -= 75  # 初始位置
        # 初速度
        v = 0
        # 单位时间为0.2s来统计轨迹，轨迹即0.2内的位移
        t = 0.2
        # 位移/轨迹列表，列表内的一个元素代表0.2s的位移
        tracks = []
        # 当前的位移
        current = 0
        # 到达mid值开始减速
        mid = distance * 4 / 5
        distance += 10  # 先滑过一点，最后再反着滑动回来
        # a = random.randint(1,3)
        while current < distance:
            if current < mid:
                # 加速度越小，单位时间的位移越小,模拟的轨迹就越多越详细
                # a = random.randint(2, 4)  # 加速运动
                a = 3
            else:
                # a = -random.randint(3, 5)  # 减速运动
                a = -2
            # 初速度
            v0 = v
            # 0.2秒时间内的位移
            s = v0 * t + 0.5 * a * (t ** 2)
            # 当前的位置
            current += s
            # 添加到轨迹列表
            tracks.append(round(s))
            # 速度已经达到v,该速度作为下次的初速度
            v = v0 + a * t
        # 反着滑动到大概准确位置
        for i in range(4):
            tracks.append(-random.randint(2, 3))
        for i in range(4):
            tracks.append(-random.randint(1, 3))
        return tracks
因为人们在滑动滑块的时候大多是先加速后减速，有时还会倒退，所以不可以做匀速直线运动，要做变速，变加速直线运动。

高中物理知识：

初速度：v0、位移：x、时间：t、加速度：a，满足如下公式：

x = v0 * t + 1/2 * a * t^2

滑块的缺口位置一开始是-37的，但我经过调试后发现老是会滑到最右端超出了界限，所以改成了-75。mid为减速阈值，到了mid距离即开始减速。另外为了提高通过率，大佬还模仿了后退的操作。
主要实现函数
    def tx_code(self):
        主要部分，函数入口
        :return: bool值，是否识别成功
        self.set_info()
        WebDriverWait(self.browser, 20, 0.5).until(
            EC.presence_of_element_located((By.ID, 'tcaptcha_iframe')))  # 等待 iframe
        self.browser.switch_to.frame(
            self.browser.find_element_by_id('tcaptcha_iframe'))  # 加载 iframe
        time.sleep(0.5)
        bk_block = self.browser.find_element_by_xpath(
            '//img[@id="slideBg"]').get_attribute('src')
        print(bk_block)
        if self.save_img(bk_block):
            dex = self.get_pos()
            if dex:
                track_list = self.get_track(dex)
                time.sleep(0.5)
                slid_ing = self.browser.find_element_by_xpath(
                    '//div[@id="tcaptcha_drag_thumb"]')  # 滑块定位
                ActionChains(self.browser).click_and_hold(
                    on_element=slid_ing).perform()  # 鼠标按下
                time.sleep(0.2)
                print('轨迹', track_list)
                for track in track_list:
                    ActionChains(self.browser).move_by_offset(
                        xoffset=track, yoffset=0).perform()  # 鼠标移动到距离当前位置（x,y）
                time.sleep(1)
                ActionChains(self.browser).release(
                    on_element=slid_ing).perform()  # print('第三步,释放鼠标')
                time.sleep(1)
                # 识别图片
                return True
            else:
                self.re_start()
        else:
            print('缺口图片捕获失败')
            return False
这个就还是定位元素的老套路了，不多做解释。
    def re_start(self):
        :return: None
        self.tx_code()
        # self.end()
三、完整代码及如何使用
基于PyCarm、python3.8、selenium3.141.0、opencv-python4.3.0.36
# -*- coding: utf-8 -*-
@author:Pineapple
@contact:cppjavapython@foxmail.com
@time:2020/8/2 17:29
@file:login.py
@desc: login with Tencen .
from selenium.webdriver.support import expected_conditions as EC  # 显性等待
from selenium.webdriver.support.wait import WebDriverWait
from selenium.webdriver.common.by import By
from selenium.webdriver import ActionChains
from selenium import webdriver
import cv2 as cv
import requests
import random
import time
class Tencent:
    识别腾讯验证码
    def __init__(self, url, username, password):
        初始化浏览器配置，声明变量
        :param url: 要登录的网站地址
        :param username: 账号
        :param password: 密码
        # profile = webdriver.FirefoxOptions()  # 配置无头
        # profile.add_argument('-headless')
        self.browser = webdriver.Chrome()
        self.wait = WebDriverWait(self.browser, 20)
        self.url = url  # 目标url
        self.username = username  # 用户名
        self.password = password  # 密码
    def end(self):
        结束后退出，可选
        :return:
        self.browser.quit()
    def set_info(self):
        填写个人信息，在子类中完成
    def tx_code(self):
        主要部分，函数入口
        :return:
        self.set_info()
        WebDriverWait(self.browser, 20, 0.5).until(
            EC.presence_of_element_located((By.ID, 'tcaptcha_iframe')))  # 等待 iframe
        self.browser.switch_to.frame(
            self.browser.find_element_by_id('tcaptcha_iframe'))  # 加载 iframe
        time.sleep(0.5)
        bk_block = self.browser.find_element_by_xpath(
            '//img[@id="slideBg"]').get_attribute('src')
        print(bk_block)
        if self.save_img(bk_block):
            dex = self.get_pos()
            if dex:
                track_list = self.get_track(dex)
                time.sleep(0.5)
                slid_ing = self.browser.find_element_by_xpath(
                    '//div[@id="tcaptcha_drag_thumb"]')  # 滑块定位
                ActionChains(self.browser).click_and_hold(
                    on_element=slid_ing).perform()  # 鼠标按下
                time.sleep(0.2)
                print('轨迹', track_list)
                for track in track_list:
                    ActionChains(self.browser).move_by_offset(
                        xoffset=track, yoffset=0).perform()  # 鼠标移动到距离当前位置（x,y）
                time.sleep(1)
                ActionChains(self.browser).release(
                    on_element=slid_ing).perform()  # print('第三步,释放鼠标')
                time.sleep(1)
                # 识别图片
                return True
            else:
                self.re_start()
        else:
            print('缺口图片捕获失败')
            return False
    @staticmethod
    def save_img(bk_block):
        :param bk_block: 图片url
        :return: bool类型，是否被保存
            img = requests.get(bk_block).content
            with open('bg.jpeg', 'wb') as f:
                f.write(img)
            return True
        except:
            return False
    @staticmethod
    def get_pos():
        注意：网页上显示的图片为缩放图片，缩放 50% 所以识别坐标需要 0.5
        :return: 缺口位置
        image = cv.imread('bg.jpeg')
        # 高斯滤波
        blurred = cv.GaussianBlur(image, (5, 5), 0)
        # 边缘检测
        canny = cv.Canny(blurred, 200, 400)
        # 轮廓检测
        contours, hierarchy = cv.findContours(
            canny, cv.RETR_EXTERNAL, cv.CHAIN_APPROX_SIMPLE)
        for i, contour in enumerate(contours):
            m = cv.moments(contour)
            if m['m00'] == 0:
                cx = cy = 0
            else:
                cx, cy = m['m10'] / m['m00'], m['m01'] / m['m00']
            if 6000 < cv.contourArea(contour) < 8000 and 370 < cv.arcLength(contour, True) < 390:
                if cx < 400:
                    continue
                x, y, w, h = cv.boundingRect(contour)  # 外接矩形
                cv.rectangle(image, (x, y), (x + w, y + h), (0, 0, 255), 2)
                # cv.imshow('image', image)  # 显示识别结果
                print('【缺口识别】 {x}px'.format(x=x / 2))
                return x / 2
        return 0
    @staticmethod
    def get_track(distance):
        :param distance: 距缺口的距离
        :return: 位移列表
        distance -= 75  # 初始位置
        # 初速度
        v = 0
        # 单位时间为0.2s来统计轨迹，轨迹即0.2内的位移
        t = 0.2
        # 位移/轨迹列表，列表内的一个元素代表0.2s的位移
        tracks = []
        # 当前的位移
        current = 0
        # 到达mid值开始减速
        mid = distance * 4 / 5
        distance += 10  # 先滑过一点，最后再反着滑动回来
        # a = random.randint(1,3)
        while current < distance:
            if current < mid:
                # 加速度越小，单位时间的位移越小,模拟的轨迹就越多越详细
                # a = random.randint(2, 4)  # 加速运动
                a = 3
            else:
                # a = -random.randint(3, 5)  # 减速运动
                a = -2
            # 初速度
            v0 = v
            # 0.2秒时间内的位移
            s = v0 * t + 0.5 * a * (t ** 2)
            # 当前的位置
            current += s
            # 添加到轨迹列表
            tracks.append(round(s))
            # 速度已经达到v,该速度作为下次的初速度
            v = v0 + a * t
        # 反着滑动到大概准确位置
        for i in range(4):
            tracks.append(-random.randint(2, 3))
        for i in range(4):
            tracks.append(-random.randint(1, 3))
        return tracks
    def move_to(self, index):
        :param index:
        :return:
    def re_start(self):
        :return: None
        self.tx_code()
        # self.end()
前面说过了，或者代码注释里也有，要写一个子类继承它，并完成set_info()函数。

#text.py 和 login.py在同一目录下
# -*- coding: utf-8 -*-
@author:Pineapple
@contact:cppjavapython@foxmail.com
@time:2020/7/29 9:00
@file:#test.py
@desc: 测试-登录腾讯网
from selenium.common.exceptions import TimeoutException
from login import Tencent
from login import EC
from login import By
import time
class Tencent_net(Tencent):
    Tencent的子类，完成set_info()函数
    def set_info(self):
        填写表单信息
        :return: None
        self.browser.get(url=self.url)
            # 首页登录按钮
            login_button = self.wait.until(EC.element_to_be_clickable((
                By.CSS_SELECTOR, 'div#top-login > div.item.item-login.fl > a.l-login'
            login_button.click()
            # 登录子页面
            self.wait.until(EC.presence_of_all_elements_located((
                By.ID, 'ptlogin_iframe'
            # 进入登录子页面
            self.browser.switch_to.frame(
                self.browser.find_element_by_id('ptlogin_iframe')
            # qq账号登录
            qq_login = self.wait.until(EC.element_to_be_clickable((
                By.ID, 'switcher_plogin'
            qq_login.click()
            # 用户名
            input_username = self.wait.until(EC.presence_of_element_located((
                By.ID, 'u'
            input_password = self.wait.until(EC.presence_of_element_located((
                By.ID, 'p'
            input_username.send_keys(self.username)
            input_password.send_keys(self.password)
            time.sleep(1)
            qq_login_button = self.wait.until(EC.element_to_be_clickable((
                By.ID, 'login_button'
            qq_login_button.click()
        except TimeoutException as e:
            print('Error:', e.args)
            self.set_info()
if __name__ == '__main__':
    url=input('url：')
    username=input('账号：')
    password=input('密码：')
    tencent=Tencent_net(url,username,password)
    tencent.re_start()
在写子类的过程中还是遇到了一些问题，就比如点击账号密码登录这个链接：

又是JavaScript:void(0)链接！！！和之前微博登录的那个还不一样，这个人为点击是可以的，可就是模拟浏览器狂点无效。让我一度误认为这种链接不可点击。

后来我把检查元素的窗口放在右边后才发现了问题：

原来登录部分的页面是个子页面，之前被我盖住了没看到！selenium打开页面后默认是在父级Frame里操作的，如果还有子Frame，它是不能获取到子Frame的结点的。这时候就要用swith_to.frame()方法来切换Frame。
如过你取消了配置无头模式，在打开浏览器的时候：

不要把鼠标放在浏览器内！！！

不要把鼠标放在浏览器内！！！

不要把鼠标放在浏览器内！！！
重要的事情说三遍，因为识别到缺口后，selenium已经模拟鼠标按住并拖动了，这时候你把鼠标移到浏览器里面，而你又没有按住，那它就会人为鼠标已经松开，释放滑块！
四、结果展示