In the Linux kernel, the following vulnerability has been resolved:
RDMA/core: always drop device refcount in ib_del_sub_device_and_put()
Since nldev_deldev() (introduced by commit 060c642b2ab8 ("RDMA/nldev: Add
support to add/delete a sub IB device through netlink") grabs a reference
using ib_device_get_by_index() before calling ib_del_sub_device_and_put(),
we need to drop that reference before returning -EOPNOTSUPP error.
A reference counting vulnerability in the Linux kernel's RDMA/core subsystem (CVE-2025-71157) allows device reference leaks when ib_del_sub_device_and_put() returns an error. This can lead to resource exhaustion and potential denial of service on systems utilizing RDMA networking. The vulnerability affects Linux kernel versions up to 6.19-rc3 and requires immediate patching for production environments.
Immediate Actions:
1. Identify systems running Linux kernel versions 6.19-rc1 through 6.19-rc3 or affected stable versions
2. Assess RDMA device usage in your infrastructure (check for InfiniBand, RoCE adapters)
3. Monitor system logs for device reference count anomalies
Patching Guidance:
1. Apply the official Linux kernel patch that ensures ib_device_get_by_index() reference is always dropped in ib_del_sub_device_and_put() error paths
2. Update to kernel version 6.19-rc4 or later, or apply backported patches to stable kernels
3. Test patches in non-production environments before deployment
4. Schedule maintenance windows for kernel updates on RDMA-enabled systems
Compensating Controls (if immediate patching unavailable):
1. Restrict RDMA device management operations to authorized administrators only
2. Implement monitoring for device reference count leaks using kernel metrics
3. Configure automatic system restart policies to mitigate resource exhaustion
4. Disable RDMA sub-device management features if not required
Detection Rules:
1. Monitor kernel logs for repeated EOPNOTSUPP errors from nldev_deldev()
2. Track RDMA device reference counts using /proc/sys/kernel/infiniband metrics
3. Alert on sustained memory pressure or resource exhaustion on RDMA systems
4. Implement netlink message auditing for device deletion attempts
الإجراءات الفورية:
1. تحديد الأنظمة التي تعمل بإصدارات نواة لينكس 6.19-rc1 إلى 6.19-rc3 أو الإصدارات المستقرة المتأثرة
2. تقييم استخدام أجهزة RDMA في البنية التحتية (التحقق من محولات InfiniBand و RoCE)
3. مراقبة سجلات النظام للكشف عن شذوذ عد مراجع الأجهزة
إرشادات التصحيح:
1. تطبيق رقعة نواة لينكس الرسمية التي تضمن إسقاط مرجع ib_device_get_by_index() دائمًا في مسارات خطأ ib_del_sub_device_and_put()
2. التحديث إلى إصدار نواة 6.19-rc4 أو أحدث، أو تطبيق الرقع المرتجعة على النوى المستقرة
3. اختبار الرقع في بيئات غير الإنتاج قبل النشر
4. جدولة نوافذ الصيانة لتحديثات النواة على الأنظمة المدعومة بـ RDMA
الضوابط البديلة (إذا لم يكن التصحيح الفوري متاحًا):
1. تقييد عمليات إدارة أجهزة RDMA للمسؤولين المصرح لهم فقط
2. تنفيذ المراقبة لتسرب عد مراجع الأجهزة باستخدام مقاييس النواة
3. تكوين سياسات إعادة تشغيل النظام التلقائية للتخفيف من استنزاف الموارد
4. تعطيل ميزات إدارة أجهزة RDMA الفرعية إذا لم تكن مطلوبة
قواعد الكشف:
1. مراقبة سجلات النواة للأخطاء المتكررة EOPNOTSUPP من nldev_deldev()
2. تتبع عد مراجع أجهزة RDMA باستخدام مقاييس /proc/sys/kernel/infiniband
3. التنبيه على الضغط المستمر على الذاكرة أو استنزاف الموارد على أنظمة RDMA
4. تنفيذ تدقيق رسائل netlink لمحاولات حذف الأجهزة