python threading 内存泄漏 python 内存泄漏分析工具

转载

编程小天匠 2023-10-07 14:11:50

问题描述

A服务，是一个检测MGR集群主节点是否发生变化的服务，使用python语言实现的。

针对每个集群，主线程会创建一个子线程，并由子线程去检测。子线程会频繁的创建和销毁。

上线以后，由于经常会有功能发布，从而重启服务，开始一段时间没有发现问题。

半个月前的周二服务发布后，大约一周时间，没有再发布。到周末的时候，突然告警系统负载高，经过排查，发现内存几乎耗尽，并查到是A服务占用巨大内存，没有释放。

排查过程

已经确定，A服务是存在内存泄露的，到底是什么地方内存使用完，却没有释放呢？

这是一个令人头疼的问题，以前确实没有遇到过Python的内存泄露。

首先，网上搜索关于python内存泄漏的问题。大体了解到，Python的内存回收是基于引用计数的，也就是说，如果某个对象被使用一次，引用计数就会增加1。对象的引用计数为0时，内存就会被回收掉。

常见的导致内存泄露的情况有两种：

(1)对象一直被全局变量使用，全局变量生命周期比较长，所以内存一直得不到释放。

(2)循环引用中的对象定义了__del__的情况.

网上提供了各种用于排查内存泄露的工具，例如objgraph、guppy、pympler等，其具体使用参考文后的链接。

看了半天这些工具的使用，感觉还是应该看看自己代码，是不是存在对象使用完，但是一直被引用的情况。

首先，排查内存泄露的位置是在主线程还是子线程。通过查看，发现「子线程一直在执行」与「子线程频繁创建和退出」两种情况下，内存消耗没有差别。这样，就可以定位到，内存泄露位置是在主线程。

接着，查看主线程的代码，发现每次创建一个子线程后，会将子线程的管理器对象，放入一个字典中，但是当子线程退出后，却没有将子线程管理器的对象从字典中删除。由于会频繁创建和销毁子线程，所以字典会越来越大，从而造成内存泄露。

解决办法

找到问题的原因了，那么解决方法就好办了。当子线程退出后，及时将子线程管理器对象从字典中删除，释放占用的内存。

本文章为转载内容，我们尊重原作者对文章享有的著作权。如有内容错误或侵权问题，欢迎原作者联系我们进行内容更正或删除文章。

提问和评论都可以，用心的回复会被更多人看到评论

发布评论

相关文章

官方博客	全部文章	热门标签	班级博客
了解我们	网站地图	意见反馈

鸿蒙开发者社区	51CTO学堂
51CTO	软考资讯

51CTO博客