查看原文
其他

Go 内存泄漏,pprof 够用了么?

豆浆大叔 金融级分布式架构 2022-11-30

文|朱德江(GitHub ID:doujiang24)

MOSN 项目核心开发者蚂蚁集团技术专家


专注于云原生网关研发的相关工作


本文 2651 字 阅读 8 分钟


MOSN 是主要使用 Go 语言开发的云原生网络代理平台,在蚂蚁集团有着几十万容器的大规模生产应用。在这种大规模的应用中,经常会遇到各种内存问题,通常情况下 pprof heap profile 可以很好帮助分析问题。不过,有时候 pprof 也不够用,也就需要我们有更合适的工具了。


1

Part.1

出生证 vs 暂住证    


首先 pprof 确实很好用,设计实现也都很精巧,有兴趣的可以查看这篇《Go 语言 pprof heap profile 实现机制》[1]


用 pprof 来分析内存泄漏,通常情况下是够用了,不过有时候,也会不够用。


这是为什么呢?因为 pprof 只是记录了内存对象被创建时的调用栈,并没有引用关系。也就是说,没有办法知道,内存对象是因为被谁引用了而导致没有被释放。对此,我的同事--烈元同学有一个很形象的比喻,pprof 只能看到出生证,却查不了暂住证。


2

Part.2

需要引用关系    


有些场景下,我们知道了泄漏的内存是从哪里申请的,但是翻了半天代码,也搞不清楚内存为什么没有释放。比如,内存对象经过复杂的调用传递,或者复杂的内存池复用机制,又或者传给了某个不熟悉的第三方库,在第三方库中有非预期的使用 ...


在这些情况下,我们会有一个很直觉的想法是,想看看这些内存对象的引用关系。


3

Part.3

内存引用关系火焰图    


内存引用关系火焰图,是一种内存对象引用关系的可视化方式,最早应用于 OpenResty XRay 产品。这个工具确实是内存分析神器,给不少的客户定位过内存问题,感兴趣的可以移步 OpenResty 官方博客[2]


下图是由一个 MOSN 服务产生的,自下而上表示的是从 GC root 到 GC object 的引用关系链,宽度表示的是对象大小(也包括其引用的对象的大小之和)


有了这样的可视化结果,我们就可以直观的看到内存对象的引用关系。


比如下图最宽的部分,表示的是 MOSN 中 cluster_manager 全局变量中引用的 cluster 内存对象:

https://github.com/mosn/mosn/blob/aecc93c4b2b4801e7992387f245fe9eefa45733d/pkg/upstream/cluster/cluster_manager.go#L82



4

Part.4

实现原理    


在生成火焰图之前,首先我们需要提取两个关键信息:


- 每个内存对象之间的引用关系;

- 每个内存对象的类型。


引用关系


获取引用关系比较简单,首先,我们可以在 heap 中找到所有的 GC 对象。然后遍历所有的对象,再结合 bitmap 信息,获取这个对象引用的其他对象。基本原理跟 GC mark 是类似的,虽然实现上很不一样,但因为这个是离线工具,可以简单粗暴的实现。


类型推导


Go 语言作为编译型静态语言,是不需要为每个内存对象存储类型信息的(有点例外的是 interface)。如果是动态类型语言,比如 Lua,则会方便很多,每个 GC 对象都存储了对象的类型。


所以,要获取每个对象的类型,还是比较麻烦的,也是投入时间最多的一块。当然,还是有解决办法的,简单来说就是做逆向类型推导,根据已知内存的类型信息,推导被引用的内存对象的类型信息。


这块还是比较复杂的,有兴趣的可以看这篇《Go 语言,如何做逆向类型推导》[3]的介绍。


生成过程


有了这两个关键信息之后,生成过程如下还是比较清晰的:


1. 获取所有的内存对象,包括类型、大小,以及他们之间的引用关系,形成一个图;


2. 从 root 对象出发,按照层次遍历,形成一棵树(也就是剪枝过程,每个对象只能被引用一次)


3. 将这棵树的完整引用关系,当做 backtrace dump 下来,count 是当前节点的总大小(包括所有子节点),也就是火焰图上的宽度;


4. 从 bt 文件生成 svg,这一步是 brendangregg 的 FlameGraph 标准工具链。


5

Part.5

使用方式    


这个工具是基于 Go 官方的 viewcore 改进来的。不过,鉴于 Go 官方不那么热心维护 viewcore 了,MOSN 社区先 fork 了一份,搞了个 mosn 分支,作为 MOSN 社区维护的主分支。


之前也给 Go 官方 debug 提交了好几个 bugfix,等后面有空,我们再去提交这个 feature。


所以,使用方式如下:

# 编译 mosn 维护的 viewcoregit clone git@github.com:mosn/debug.gitcd debug/cmd/viewcorego build .
# 假设已经有了一个 core 文件(CORE-FILE)# 以及对应的可执行程序文件(BIN-FILE)viewcore CORE-FILE --exe BIN-FILE objref ref.bt
# 下载 FlameGraph 工具git clone git@github.com:brendangregg/FlameGraph.git../FlameGraph/stackcollapse-stap.pl ref.bt | ../FlameGraph/flamegraph.pl > ref.svg
# 浏览器打开 ref.svg 即可看到火焰图

如果使用碰到问题,可以随时联系我们或提交 issuehttps://github.com/mosn/mosn/issues

当然,倘若你成功定位了某个问题,也欢迎与我们共同分享,Let's have fun together!


*MOSN 用户钉钉群:33547952


相关链接 

[1]《Go 语言 pprof heap profile 实现机制》

https://uncledou.site/2022/go-pprof-heap/

[2]OpenResty 官方博客

https://blog.openresty.com.cn/cn/openresty-xray-case-yundun/

[3]《Go 语言,如何做逆向类型推导》

https://uncledou.site/2022/go-type-derivation/


了解更多…

MOSN Star 一下✨:
https://github.com/mosn/mosn


插播一条好消息!🤩

对 Go 语言开发感兴趣的小伙伴们
欢迎大家参与到近期正热的 GoCity 项目体验
点击查看下方视频,快速入门吧🥳

   本周推荐阅读  


MOSN 反向通道详解


Go 原生插件使用问题全解析

Go 代码城市上云--KusionStack 实践

MOSN 文档使用指南

您可能也对以下帖子感兴趣

文章有问题?点此查看未经处理的缓存