关于python:python内存泄露排查

7次阅读

共计 2153 个字符,预计需要花费 6 分钟才能阅读完成。

最近线上某台虚拟机隔三差五就会挂掉,通过业务日志基本上排查到每次出错都源于某一个申请。于是对该申请开展排查。

1,先确认罪魁祸首:

执行该申请之前之前的虚拟机 memory 和 python 过程占用的资源:

执行一次该申请之后的资源占用状况:

python 占用的资 cpu 在服务执行过程中会有所晋升,然而申请完结后,cpu 能够复原到执行之前的程度;而 VIRT,RES,内存占比却有显著晋升,且执行实现后并未降落。屡次执行,内存占用累积上涨。由此推断,罪魁祸首是该申请,并且可能是由内存泄露引起的。

2,python 内存泄露的工具

https://zhmin.github.io/2018/12/22/python-meomory-leak/

通过网上一系列的查找,理解到用于排查 python 内存泄露的工具有:objgraph,pympler,guppy

objgraph

能够查看对象被援用次数的工具,也能够查看对象调用图。

这里次要用到的办法:

show_most_common_types()

show_growth()

集体感觉 show_growth 更好用写,能够看到增量数据。

pympler

pympler 工具能够很容易看到内存的应用状况

guppy

guppy 能够查看到 heap 内存的具体应用状况,哪些对象占用多少内存

3,代码定位

先写一个记录对象援用次数的办法

import os
import objgraph

def obj_graph_stat(mark=''):
    file_path = r'D:\obj_graph.txt'
    if not os.path.exists(file_path):
        file = open(file_path, 'w')
        file.close()
    file = open(file_path, 'a')
    file.write(f'******************{str(now_datetime())}-{mark}******************\n')
    objgraph.show_most_common_types(limit=20, file=file)
    file.write(f'-'*20)
    file.write('\n')
    # 返回 heap 内存详情
    # heap = hp.heap()
    # byvia 返回该对象的被哪些援用,heap[0] 是内存耗费最大的对象
    # references = heap[0].byvia
    # file.write(str(references))
    file.write('\n\n')
    file.close()

把该办法放在可疑代码前后执行

通过前后执行比照发现援用 list,dict 等对象均有较大减少。而后对代码进行走读,逐渐放大范畴,对可疑代码段进行前后比照,确定最小范畴:

同时对象援用的前后比照也佐证了这一点,如上图。该段代码是基于 matplotlib.pyplot 绘制一个曲线图,对代码主题性能不影响不是很大,咱们先把该段代码正文掉,再次执行看对象前后援用次数。

通过比照,发现对象援用次数失常了!!!

在服务器部署执行后,比照 top 信息, 执行前:

执行中

执行后

执行实现后内存复原到执行前相当的程度,问题迎刃而解!

4,刨根问底

抓到真凶后,咱们总归是好奇,想晓得假相的。通过度娘咱们发现:

Python 循环画图时内存泄露的问题:http://www.biexiaoyu1994.com/%E4%BB%A3%E7%A0%81%E8%B8%A9%E5%9D%91/2019/06/13/python_plot_mem_leak/

matplotlib 画图内存爆表:https://blog.csdn.net/quanshengxixin/article/details/68953314

matplotlib 内存溢出报错:https://blog.csdn.net/mym_74/article/details/102887252

利用 matplotlib 绘制图片,并且将图片保留到文件中。因为没有及时的将内存中的图像革除,以致内存爆表,零碎卡死。

pyplot 是一个模块,它收集了一些容许 matplotlib 以性能形式应用的函数。我在这里假如 pyplot 已被导入为“import matplotlib.pyplot as plt”。在这种状况下,有三个不同的命令能够删除内容:

plt.cla() 革除轴,以后流动轴在以后图中。它放弃其余轴不变。

plt.clf() 革除整个以后数字。与所有的轴,但来到窗口关上,这样它就能够再用在其余的 plots 上了。

plt.close() 关上窗户,如果未另指定,则该窗口将是以后窗口。

因而,哪种性能最适宜您,取决于您的用例。

close()函数还容许指定哪个窗口应该敞开。参数能够是应用 figure(number_or_name)创立的窗口的数字或名称。也能够是取得的图形实例,即应用 fig = figure()。如果没有人提出任何论点 close(),以后流动的窗口将敞开。此外,还有语法 close(’all’),它敞开所有数字。

总结经验,也就是咱们在应用 matplotlib.pyplot 时,须要在前面追加一个开释操作。

总体来说这是一次因为经验不足导致的犯错,最终解决办法不简单,然而重在问题排查的过程和办法,学到了很多。

正文完
 0