Playwright 是一个开源的自动化测试工具,用于编写和运行浏览器端到端测试。它由 Microsoft Edge 团队开发,并支持多个浏览器,包括 Chromium、Firefox 和 WebKit。

Playwright 的目标是提供一个简单而强大的工具,可以跨不同的浏览器进行自动化测试。它提供了一套易于使用的 API,可以模拟用户与浏览器的交互,执行各种操作,如导航到网页、点击元素、填写表单、截取屏幕截图等。它还支持并发执行测试,可以在多个浏览器实例中同时运行测试,提高测试效率。

总结起来,Playwright 是一个功能强大、易于使用的跨浏览器自动化测试工具,适用于编写和运行浏览器端到端测试。它支持多种编程语言,具有一致的 API 和丰富的调试功能,帮助开发人员构建可靠的自动化测试套件。

这里我写一个演示案例,可以去水印,获取笔记信息。关键要调用x-s,x-t,x-comment等参数。

用playwright获取小红书x-s,x-t,x-comment以及调用接口获取笔记信息_API

 with sync_playwright() as playwright:
//code by QQ:10572137
        sign_result = example(playwright)
        response = {
            'x-s': sign_result['X-s'],
            'x-t': str(sign_result['X-t'])
        }
        return jsonify(response)

 获取标题py代码:

from playwright.sync_api import sync_playwright
 
def scrape_redbook_titles():
    with sync_playwright() as playwright:
        browser = playwright.chromium.launch()
        context = browser.new_context()
        page = context.new_page()
        
        # 导航到小红书网站
        page.goto('https://www.xiaohongshu.com/')
        
        # 等待页面加载完成
        page.wait_for_load_state('networkidle')
        
        # 获取所有标题元素
        title_elements = page.query_selector_all('.title')
        
        # 提取标题文本
        titles = [title_element.text_content() for title_element in title_elements]
        
        # 打印标题
        for title in titles:
            print(title)
        
        # 关闭浏览器
        context.close()
        browser.close()
 
# 执行抓取
scrape_redbook_titles()