Linux内核内存泄漏怎么搞?
1、Kmemleak介绍
在Linux内核开发中,Kmemleak是一种用于检测内核中内存泄漏的工具。
(资料图片)
内存泄漏指的是程序中已经不再使用的内存没有被妥善地释放,导致内存的浪费。内核中的内存泄漏同样会导致系统性能下降、系统崩溃等问题。
Kmemleak能够检测内核中的内存泄漏,通过检测内核中未被释放但又无法找到其使用位置的内存,进一步定位、修复内存泄漏的问题。
在用户空间,我们常用Valgrind来检测;
在内核空间,我们常用Kmemleak来检测。
2、如何使用Kmemleak
2.1 内核配置
内核打开相应配置:
CONFIG_DEBUG_KMEMLEAK:Kmemleak被加入到内核
CONFIG_DEBUG_KMEMLEAK_EARLY_LOG_SIZE设置为16000:该参数为记录内存泄露信息的内存池,越大记录信息越多。
CONFIG_DEBUG_KMEMLEAK_DEFAULT_OFF :Kmemleak默认开关状态
依赖的配置:
CONFIG_DEBUG_KERNEL:打开内核调试功能
CONFIG_DEBUG_FS:需要借助到debugfs
CONFIG_STACKTRACE:记录进程的堆栈信息
2.2 用户空间配置
我们要想使用Kmemleak,需要挂在debugfs,来查看泄露的情况。
进入文件系统后,进行挂载:
mount-tdebugfsnodev/sys/kernel/debug/#挂在debugfs
设置扫描时间:
echoscan=10>/sys/kernel/debug/kmemleak#10S扫描一次
默认内存泄露检测时间为10min,上面设置为10s一次
查看泄露情况:
cat/sys/kernel/debug/kmemleak#查看内存泄露情况
其他指令:
echoscan>/sys/kernel/debug/kmemleak#触发一次扫描echoclear>/sys/kernel/debug/kmemleak#清除当前kmemleak记录的泄露信息echooff>/sys/kernel/debug/kmemleak#关闭kmemleak(不可逆转的)echostack=off>/sys/kernel/debug/kmemleak#关闭任务栈扫描echostack=on>/sys/kernel/debug/kmemleak#使能任务栈扫描echoscan=on>/sys/kernel/debug/kmemleak#启动自动内存扫描线程echoscan=off>/sys/kernel/debug/kmemleak#停止自动内存扫描线程echoscan=>/sys/kernel/debug/kmemleak#设置自动扫描线程扫描间隔,默认是600,设置0则是停止扫描echodump=>/sys/kernel/debug/kmemleak#dump某个地址的内存块信息,比如上面的echodump=0xffffffc008efd200>/sys/kernel/debug/kmemleak即可查看详细信息
2.3 通过Linux启动参数控制开关
Kmemleak的默认开关状态可以通过CONFIG_DEBUG_KMEMLEAK_DEFAULT_OFF 配置来控制,当然也可以通过向Linux内核启动参数中加入kmemleak=off来控制。
3、Kmemleak原理
Kmemleak提供了一种跟踪垃圾回收器tracing garbage collector的原理,来检测内核中存在的内存泄露,其不同之处在于:孤立的对象并没有被释放掉,而是通过/sys/kernel/debug/kmemleak仅仅被报告。
这种方法同样应用于Valgrind中,不过该工具主要用于检测用户空间不同应用的内存泄露情况。
在用户空间,我们常用Valgrind来检测应用进程;
在内核空间,我们常用Kmemleak来检测内核代码。
通过kmalloc()、vmalloc()、kmem_cache_alloc()等函数分配内存时,会跟踪指针,堆栈等信息,将其存储在一个红黑树中。
同时跟踪相应的释放函数调用,并从kmemleak数据结构中删除指针。
简单理解:相当于追踪内存分配相关接口,记录分配内存的首地址,堆栈大小等信息,在内存释放阶段将其删除。
我们通过查看相关内核文档可知,内存泄露检测的扫描算法步骤如下:
将所有对象标记为白色(最后剩余的白色对象将被视为孤立对象)
从数据段和堆栈开始扫描内存,根据红黑树中存储的地址信息来检查值,如果找到指向白色对象的指针,则添加到灰色列表
扫描灰色列表以查找地址匹配的对象,直到灰色列表完成
剩下的白色对象被视为孤立对象,并通过/sys/kernel/debug/kmemleak进行报告
4、Kmemleak API接口
kmemleak_init-初始化kmemleakkmemleak_alloc-内存块分配通知kmemleak_alloc_percpu-通知percpu内存块分配kmemleak_vmalloc-通知vmalloc()内存分配kmemleak_free-通知内存块释放kmemleak_free_part-通知释放部分内存块kmemleak_free_percpu-通知percpu内存块释放kmemleak_update_trace-更新对象分配堆栈跟踪kmemleak_not_leak-将对象标记为非泄漏kmemleak_ignore-不扫描或报告对象泄漏kmemleak_scan_area-在内存块内添加扫描区域kmemleak_no_scan-不扫描内存块kmemleak_erase-擦除指针变量中的旧值kmemleak_alloc_recursive-作为kmemleak_alloc,但检查递归性kmemleak_free_recursive-作为kmemleak_free,但检查递归性
5、Kmemleak特殊情况
漏报:真正内存泄露了,但是未报告,因为在内存扫描期间找到的值指向此类对象。为了减少误报的数量,kmemleak提供了kmemleak_ignore,kmemleak_scan_area,kmemleak_no_scan和kmemleak_erase功能
误报:实际没有泄露,但是却错误的报告了内存泄露。kmemleak提供了kmemleak_not_leak功能。
6、Kmemleak验证
内核也提供了一个示例:kmemleak-test模块,该模块用以判断是否打开了Kmemleak功能。通过配置CONFIG_DEBUG_KMEMLEAK_TEST选项可以选择。
#modprobekmemleak-test#echoscan>/sys/kernel/debug/kmemleak
#cat/sys/kernel/debug/kmemleakunreferencedobject0xffff89862ca702e8(size32):comm"modprobe",pid2088,jiffies4294680594(age375.486s)hexdump(first32bytes):6b6b6b6b6b6b6b6b6b6b6b6b6b6b6b6bkkkkkkkkkkkkkkkk6b6b6b6b6b6b6b6b6b6b6b6b6b6b6ba5kkkkkkkkkkkkkkk.backtrace:[<00000000e0a73ec7>]0xffffffffc01d2036[<000000000c5d2a46>]do_one_initcall+0x41/0x1df[<0000000046db7e0a>]do_init_module+0x55/0x200[<00000000542b9814>]load_module+0x203c/0x2480[<00000000c2850256>]__do_sys_finit_module+0xba/0xe0[<000000006564e7ef>]do_syscall_64+0x43/0x110[<000000007c873fa6>]entry_SYSCALL_64_after_hwframe+0x44/0xa9...审核编辑:汤梓红
标签: