selenium破解滑动验证码

发表于 2021-06-27 更新于 2023-11-09 分类于 rd ， python Changyan：本文字数： 638 阅读时长 ≈ 2 分钟

滑动验证码是本次项目目标网站的一个反扒策略，咱这小白借助selenium如何实现自动化破解滑动验证码。

之前的文章里写过selenium篇之滑动验证码使用PIL计算确缺口位置坐标的方式实现滑动验证码的破解，本次我们直接利用第三方来过滑动验证码，开发效率上会高很多。

前提准备

我们这里依然采用的是快识别，支持n多种验证码识别功能。

关于滑动验证码滑动轨迹，经过实测，目标网站反爬策略并没有那么严格，几乎只要不是一次滑动刚好对接就没问题。

代码正文

class UnlockMixin:
    """验证码解锁"""

    @staticmethod
    def base64_api(uname, pwd, img_base64, typeid):
        """
            获取验证码缺口
            :param uname: 用户名
            :param pwd: 密码
            :param img_base64: selenium可直接拿到验证码base64
            :param typeid: 33
            :return:目标x轴坐标或错误信息
        """
        data = {"username": uname, "password": pwd, "typeid": typeid, "image": img_base64}
        url = "http://api.ttshitu.com/predict"
        result = json.loads(requests.post(url, json=data).text)
        if result['success']:
            return result["data"]["result"]
        else:
            return result["message"]
        return ""

    def unlock(self):
        """解锁验证码"""
        if "请完成下列验证后继续" in self.driver.page_source:
            print("验证码出现了，快来解锁啊！")
            # 缺口背景图
            slide_img = self.driver.find_element_by_id("captcha-verify-image")
            # 找到滑块
            btn = self.driver.find_element_by_xpath('//*[@id="secsdk-captcha-drag-wrapper"]/div[2]')
            # 获取图片base64
            screenshot_as_base64 = slide_img.screenshot_as_base64
            # 获取模板的x坐标
            slide_width = int(
                UnlockMixin.base64_api(uname='用户名', pwd='密码', img_base64=screenshot_as_base64, typeid=33))
            time.sleep(5)
            # 获取生成滑动距离的滑动轨迹（滑块有宽度，实测目标网站-6刚好是目标距离）
            tracks = UnlockMixin.get_track(slide_width - 6)
            # 按下滑块
            ActionChains(self.driver).click_and_hold(btn).perform()
            time.sleep(0.15)
            # 循环每次滑动距离，拖动鼠标
            for x in tracks:
                # print("拖动元素", x)
                ActionChains(self.driver).move_by_offset(xoffset=x, yoffset=0).perform()
            # 释放鼠标
            ActionChains(self.driver).release(btn).perform()
            time.sleep(5)

    @staticmethod
    def get_track(length):
        """生成滑动轨迹
       	滑动值拆分成和等于滑动值的数组
        """
        lis = []
        # 间隔通过随机范围函数来获得,每次移动5到10步
        x = random.randint(5, 10)
        # 生成轨迹并保存到list内
        while length - x >= 5:
            lis.append(x)
            length = length - x
            x = random.randint(5, 10)
        # 最后五步都是一步步移动
        for i in range(length):
            lis.append(1)
        return lis
    
if __name__ == '__main__':
    option = webdriver.ChromeOptions()
    # 模拟真正浏览器
    option.add_experimental_option('excludeSwitches', ['enable-automation'])
    # chrome驱动服务
    service = Service(r"chromedriver.exe")
    # 实例化浏览器驱动
    driver = webdriver.Chrome(service=service, options=option)
    # 窗口最大化
    driver.maximize_window()
    # 打开页面，等待加载
    driver.get('https://www.douyin.com/video/7037691282721934599')
    # 随机等待几秒钟
    time.sleep(random.random() * 5)
	un_handle = UnlockMixin()
    # 判断是否有滑动验证码，有则解除
    un_handle.unlock()
    time.sleep(1000)