利用python里的pyppeteer+谷歌插件获取小红书x-s,x-t抓包笔记数据

原创

华 2023-06-12 16:25:29 ©著作权

©著作权归作者所有：来自51CTO博客作者华的原创作品，请联系作者获取转载授权，否则将追究法律责任

大家好，我是你们的技术博主。今天我们将探讨如何使用Python库Pyppeteer来获取小红书的X-S和X-T抓包数据。这对于研究和理解小红书的API请求非常有帮助。在开始前，我想提醒大家，我们要遵守所有相关的使用协议和隐私法规，不要用这些技术来做任何非法的事情。

让我们一起开始吧。

安装必要的包

首先，我们需要确保已经安装了python, pyppeteer 和 beautifulsoup4。如果还没有的话，可以在命令行输入以下命令来安装：

pip install pyppeteer beautifulsoup4

启动Pyppeteer

使用Pyppeteer的第一步是启动一个Headless浏览器。Headless浏览器是没有图形用户界面的浏览器，可以在后台进行操作。

from pyppeteer import launch

browser = await launch()
page = await browser.newPage()

打开小红书

下一步，我们用Pyppeteer的goto函数来打开小红书。

await page.goto('https://www.xiaohongshu.com/')

监听网络请求

现在，我们开始监听网络请求。我们可以使用page.on函数来完成。我们特别关注X-S和X-T这两个请求头的值。

#Q:10572137 v:kakuapi www.wxticket.com
def print_request(req):
    headers = req.headers
    if 'x-s' in headers and 'x-t' in headers:
        print('X-S:', headers['x-s'])
        print('X-T:', headers['x-t'])

page.on('request', lambda req: print_request(req))

在上面的代码中，我们定义了一个函数print_request，这个函数将会在每一个请求发出的时候被调用，打印出X-S和X-T的值。