Playwright 是一个开源的自动化测试工具,用于编写和运行浏览器端到端测试。它由 Microsoft Edge 团队开发,并支持多个浏览器,包括 Chromium、Firefox 和 WebKit。
Playwright 的目标是提供一个简单而强大的工具,可以跨不同的浏览器进行自动化测试。它提供了一套易于使用的 API,可以模拟用户与浏览器的交互,执行各种操作,如导航到网页、点击元素、填写表单、截取屏幕截图等。它还支持并发执行测试,可以在多个浏览器实例中同时运行测试,提高测试效率。
总结起来,Playwright 是一个功能强大、易于使用的跨浏览器自动化测试工具,适用于编写和运行浏览器端到端测试。它支持多种编程语言,具有一致的 API 和丰富的调试功能,帮助开发人员构建可靠的自动化测试套件。
这里我写一个演示案例,可以去水印,获取笔记信息。关键要调用x-s,x-t,x-comment等参数。
with sync_playwright() as playwright:
//code by QQ:10572137
sign_result = example(playwright)
response = {
'x-s': sign_result['X-s'],
'x-t': str(sign_result['X-t'])
}
return jsonify(response)
获取标题py代码:
from playwright.sync_api import sync_playwright
def scrape_redbook_titles():
with sync_playwright() as playwright:
browser = playwright.chromium.launch()
context = browser.new_context()
page = context.new_page()
# 导航到小红书网站
page.goto('https://www.xiaohongshu.com/')
# 等待页面加载完成
page.wait_for_load_state('networkidle')
# 获取所有标题元素
title_elements = page.query_selector_all('.title')
# 提取标题文本
titles = [title_element.text_content() for title_element in title_elements]
# 打印标题
for title in titles:
print(title)
# 关闭浏览器
context.close()
browser.close()
# 执行抓取
scrape_redbook_titles()