DLm:意外的 VTE 重新启动并显示 DLmV0199E 和 btifc 驱动程序错误
Summary: VTE 可能会意外重新启动,通常会生成 ConnectHome 事件 (DLmV0199E) 和核心转储。 此问题已在 DLm 5.5.0.4 热修复程序 2 中观察到,还可能会影响 DLm 5.5.0.4 热修复程序 1。
Symptoms
VTE 可能会在没有警告的情况下重新启动。
在 ConnectHome 中,可能会报告以下事件: DLmV0199E – VTE unexpectedly restarted without a clean shutdown.
在 /var/log/messages,可能会观察到类似于以下内容的条目:
2025-09-23T18:14:35.718486-07:00 vte2 kernel: [37095220.390346] INFO: rcu_sched self-detected stall on CPU
2025-09-23T18:14:35.718502-07:00 vte2 kernel: [37095220.390351] 17-...: (15000 ticks this GP) idle=e46/140000000000001/0 softirq=1383296613/1383296613 fqs=7429
2025-09-23T18:14:35.718504-07:00 vte2 kernel: [37095220.390351] (t=15001 jiffies g=1259992788 c=1259992787 q=35986)
2025-09-23T18:14:35.718505-07:00 vte2 kernel: [37095220.390354] NMI backtrace for cpu 17
2025-09-23T18:14:35.718506-07:00 vte2 kernel: [37095220.390356] CPU: 17 PID: 19300 Comm: btifc_rxbufs/2 Tainted: G W OE 4.12.14-122.173-default #1 SLE12-SP5
2025-09-23T18:14:35.718525-07:00 vte2 kernel: [37095220.390357] Hardware name: Dell Inc. PowerEdge R740/0YWR7D, BIOS 2.19.1 06/04/2023
2025-09-23T18:14:35.718526-07:00 vte2 kernel: [37095220.390357] Call Trace:
2025-09-23T18:14:35.718526-07:00 vte2 kernel: [37095220.390359] <IRQ>
2025-09-23T18:14:35.718527-07:00 vte2 kernel: [37095220.390365] dump_stack+0x64/0x89
2025-09-23T18:14:35.718528-07:00 vte2 kernel: [37095220.390368] nmi_cpu_backtrace+0x98/0xa0
2025-09-23T18:14:35.718529-07:00 vte2 kernel: [37095220.390371] ? irq_force_complete_move+0x130/0x130
2025-09-23T18:14:35.718530-07:00 vte2 kernel: [37095220.390373] nmi_trigger_cpumask_backtrace+0xdd/0x120
.
2025-09-23T18:14:35.718551-07:00 vte2 kernel: [37095220.390413] ibtifc_ql_send_rx_buffers_thread+0x19/0x240 [btifc_commdrv]
Cause
FICON 驱动程序中的软锁定会导致 NMI 触发并重新启动。
Resolution
此问题已在 DLm 固件版本 V5.5.0.6 及更高版本中得到解决。