Cisco MDS:MDS 9250i/9148s 意外重新启动
摘要: Cisco MDS:MDS 9250i/9148s 意外重新启动
症状
MDS 9250i/9148s 意外出现以下问题:`show system reset-reason`----- reset reason for module 1 (from Supervisor in slot 1) ---1) At 974739 usecs after Tue Jan 15 21:37:17 2019 Reason: Reset triggered due to HA policy of Reset Service: sysmgr stateful recovery Version: 8.1(1a)
上述原因可能会有所不同,例如内核死机或 hap 重置Logging nvram may also contain the following:%KERN-0-SYSTEM_MSG: [5880833.470207] BUG: soft lockup - CPU#0 stuck for 22s! [kworker/0:1:316] - kernel%KERN-0-SYSTEM_MSG: [5880833.552479] Call Trace: - kernel%KERN-0-SYSTEM_MSG: [5880833.583767] [e21a7d60] [c0301b24] rtc_handle_legacy_irq+0x98/0xbc (unreliable) - kernel%KERN-0-SYSTEM_MSG: [5880833.672425] [e21a7d80] [c0301c70] rtc_timer_do_work+0x98/0x1f4 - kernel%KERN-0-SYSTEM_MSG: [5880833.744396] [e21a7e50] [c005d2d4] process_one_work+0x144/0x3dc - kernel%KERN-0-SYSTEM_MSG: [5880833.816356] [e21a7e80] [c005d990] worker_thread+0x12c/0x5d8 - kernel%KERN-0-SYSTEM_MSG: [5880833.885188] [e21a7ee0] [c0063854] kthread+0xc8/0xdc - kernel%KERN-0-SYSTEM_MSG: [5880833.945679] [e21a7f40] [c00107f0] ret_from_kernel_thread+0x5c/0x64 - kernel
show system internal kernel nvram-messages previous
- “soft lockup”行通常会提到“kworker”
- 主要签名是软锁定消息后面的调用跟踪将始终提到“rtc”。
如下: nsecs[857336919]BUG: soft lockup - CPU#0 stuck for 22s! [kworker/0:1:316]GPR08: 00000000 00000000 00000001 00000000 24002082 NIP [c01fd358] rb_erase+0x3ac/0x3d8LR [c01fe4ec] timerqueue_del+0x6c/0xacCall Trace:[e21a7d60] [c0301b24] rtc_handle_legacy_irq+0x98/0xbc (unreliable)[e21a7d80] [c0301c70] rtc_timer_do_work+0x98/0x1f4[e21a7e50] [c005d2d4] process_one_work+0x144/0x3dc[e21a7e80] [c005d990] worker_thread+0x12c/0x5d8[e21a7ee0] [c0063854] kthread+0xc8/0xdc[e21a7f40] [c00107f0]
原因
意外重新启动是由以下 Cisco 错误 ID
引起的:CSCvh21454 MDS 9250i 或 MDS 9148S 自动重新加载
此问题仅适用于运行以下 Cisco NX-OS 版本的 MDS 9250i 和 MDS 9148S:
8.1(1)
8.2(1a)
8.2(1)
8.2(2)
根据错误 ID 显示系统内部内核 nvram-messages 的内容:
BUG: soft lockup - CPU#1 stuck for 22s! [kworker/1:1:1116] Call Trace: [e0f47d60] [c0301b10] rtc_handle_legacy_irq+0x84/0xbc (unreliable) [e0f47d80] [c0301c8c] rtc_timer_do_work+0xb4/0x1f4
此外,根据错误 ID:
这是一个非常罕见的问题,但可能随时发生,没有任何外部刺激。一旦出现问题,交换机将重新加载并正常工作。
解决方案
没有。
分辨率:
已在以下 NX-OS 版本中解决此问题:
8.1(1b)8.3
(1)