在上一章节 [Python学习笔记]Requests性能优化之Session 中,通过在 Resquests 中使用 session,将 Python 脚本的运行效率提升了 3 倍。但当时对问题的排查主要是基于程序实现逻辑的推断,并没有实质性的证据。

本次使用 Python 的性能分析工具对脚本进行分析,找到优化点。首先介绍两个工具 cProfile 和 snakeviz 对程序性能进行定性分析。


目录

  • 工具介绍
  • 1. cProfile
  • 2. snakeviz
  • 性能分析
  • 运行优化前脚本
  • 运行优化后脚本
  • 参考


工具介绍

1. cProfile

cProfile 是 Python 自带的性能分析模块,不需要额外安装,可以统计程序中函数的调用次数和时间。

python -m cProfile -o log.profile macd_all.py
  • 以上命令会运行 macd_all.py,对每个函数的调用进行统计,并记录到 log.profile 文件中,方便分析。

2. snakeviz

SnakeViz是一个Python模块,用于可视化Python程序的性能分析结果。

安装

pip install snakeviz

分析 cProfile 日志

snakeviz.exe -p 8080 log.profile
  • 以上命令会打开一个 HTTP Server,使用8080 端口,并自动打开本地浏览器。

说明:

  • ncalls:表示函数调用的次数;
  • tottime:表示指定函数的总的运行时间,除掉函数中调用子函数的运行时间;
  • percall:(第一个percall)等于 tottime/ncalls;
  • cumtime:表示该函数及其所有子函数的调用运行的时间,即函数开始调用到返回的时间;
  • percall:(第二个percall)即函数运行一次的平均时间,等于cumtime/ncalls;
  • filename:lineno(function):每个函数调用的具体信息;

性能分析

运行优化前脚本

python -m cProfile -o log1.profile macd_all_v1.py

snakeviz.exe -p 8080 log1.profile

[Python学习笔记]Python 性能分析_性能优化


[Python学习笔记]Python 性能分析_网络_02


[Python学习笔记]Python 性能分析_性能优化_03

[Python学习笔记]Python 性能分析_python_04

看图可以发现耗时最长的函数就是make_request 这个网络请求函数,而在下面明细中可以看见connect of _socket.socket 耗时很长。
初步可以判断,程序大量时间耗费在建立网络连接方面。

运行优化后脚本

python -m cProfile -o log1.profile macd_all_v2.py

snakeviz.exe -p 8080 log2.profile

[Python学习笔记]Python 性能分析_学习_05


[Python学习笔记]Python 性能分析_学习_06


[Python学习笔记]Python 性能分析_python_07


[Python学习笔记]Python 性能分析_学习_08

对比优化前的分析图,可以发现 make_request 这个函数耗时从 107s 降低到了 24.3s , connect of _socket.socket 调用次数从9040次降低到了1次,总耗时从 77.93s 下降到毫秒级别。

从分析图中可以看出当前耗时较长的函数是 'recv_into' of '_socket.socket',共调用 18037次,耗时 21.78s。
recv_info 会从套接字接收数据,并将其存储在给定的缓冲区中。

在《[Python学习笔记]Requests性能优化之Session》章节有提到,这个脚本会查询 9037 张表,共 1779929 条数据;写入 9037 张表,每个表 1 条数据。

脚本中涉及网络方面方面的操作:

  1. 从数据库查询所有股票代码(1次查询)
  2. 向数据库写入测试记录(1次写入)
  3. 根据代码逐个查询交易数据(9037次查询)
  4. 将结果写入数据库(1次写入)

由此可知,程序主要优化点在于减低数据库查询次数,比如说一次查询多只股票的数据。

参考

Python基础(11) 性能测试工具 cProfile

使用 cProfile 和火焰图调优 Python 程序性能

[量化投资-学习笔记013]Python+TDengine从零开始搭建量化分析平台-策略回测进阶

[Python学习笔记]Requests性能优化之Session