python+playwright 学习-72 设置window.navigator.webdriver属性为false 跳过网站反爬检测

原创

上海悠悠 2023-11-02 10:26:24 ©著作权

文章标签 python+playwright chrome 自动化测试标签页 文章分类 HarmonyOS 后端开发

©著作权归作者所有：来自51CTO博客作者上海悠悠的原创作品，请联系作者获取转载授权，否则将追究法律责任

前言

有些网站有反爬机制，比如用代码启动的浏览器会被检测到，需要人机验证，用脚本去点击或者滑动滑动虽然能滑动，但是会认证失败。

用playwright 和 selenium 启动的浏览器都会用个webdriver 属性。浏览器会根据这个属性判断是否是人工正常操作。

python+playwright 学习-72 设置window.navigator.webdriver属性为false 跳过网站反爬检测_自动化测试

window.navigator.webdriver属性

人工正常打开的浏览器 window.navigator.webdriver属性为false

python+playwright 学习-72 设置window.navigator.webdriver属性为false 跳过网站反爬检测_python+playwright_02

以下是通过playwright 打开的浏览器窗口，查看window.navigator.webdriver属性为true

python+playwright 学习-72 设置window.navigator.webdriver属性为false 跳过网站反爬检测_标签页_03

跳过反爬检测机制

在启动浏览器时添加以下配置项

args=['--disable-blink-features=AutomationControlled']

示例代码

from playwright.sync_api import sync_playwright


with sync_playwright() as p:
    # 非无痕模式启动
    browser = p.chromium.launch_persistent_context(
        # 指定本机用户缓存地址
        user_data_dir="D:\\chrome_userx\\yoyo",
        # 接收下载事件
        accept_downloads=True,
        # 设置 GUI 模式
        headless=False,
        bypass_csp=True,
        slow_mo=100,
        channel="chrome",
        # 跳过反爬检测
        args=['--disable-blink-features=AutomationControlled']
    )
    page = browser.new_page()  # 打开标签页
    page.goto("http://...../users/login/")