在线上运行的程序,有一天突然前端响应缓慢,但是后台日志依旧还在正常输出。针对这种情况,本篇博客主要是进行问题解决的过程说明。
软件 | 版本 (资料图片仅供参考) |
Centos | 6.4 |
JDK | 1.6 |
proxool | 0.9.0RC3 |
jstat -gcutil 13062 5000
从上图可以看出,现在项目是处于频繁GC的状态,内存基本都被占满了。
jmap -histo:live 13062 | head -20
从上图可以看到,目前是数据库相关的类占用了比较大的空间。其中有proxool,这个时候猜测是因为proxool的问题导致的。
jmap -dump:format=b,file=heap-dump.bin 13062
将第4步导出的堆栈信息,使用MAT工具打开,打开之后,进行分析,分析结果如下:
从图中,可以知道,Finalizer占用了最大的空间,达到了2.9GB。
之后,我们使用以下命令将该进程的堆栈信息dump下来,如下:
jstack 13062 > 13062 _error.log
并搜索Finalizer字眼,结果如下:
这个就是比较著名的proxool
内存泄露问题,在JVM
回收WrappedConnection
对象时,由于代理类重写了finalize
方法,WrappedConnection
方法被丢进引用队列等待finalizer
线程执行finalize
方法,finalize
本身没有额外的实现,但是代理类在执行该方法之前会做一个isClose
的判断,而jdbc oracle
的实现类则使用了synchronize
修饰了isClose
,导致业务逻辑从池里拿出来该连接使用的时候会与finalize
线程竞争该锁,一旦业务逻辑处于繁忙状态则finalizer
线程执行的频率大大减小,此时在队列中的引用依然存在,对象仍然会在堆中存活。
既然知道了原因,那么覆写org.logicalcobwebs.proxool.WrappedConnection
类,添加以下代码:
然后重新编译提交到项目中,并重启。
升级补丁之后,重启项目。到了第二天,再将堆栈信息dump下来查看,已经没有Finalizer的内存占用了。问题得到解决。
本篇博文主要是记录此次解决过程中使用的各种命令,熟悉使用可以解决很多问题。
解决proxool连接oracle内存溢出的问题压测调优之遇到的proxool问题
如果我的文章对大家产生了帮忙,可以在文章底部点个赞或者收藏;如果有好的讨论,可以留言;
如果想继续查看我以后的文章,可以点击关注可以扫描以下二维码,关注我的公众号:枫夜之求索阁,查看我最新的分享!