Connectrix Cisco: el switch se apaga debido a un error de kernel panic

Summary: El switch MDS estaba inactivo y no se volvió a cargar después de un estado de alarma del kernel. Tuve que encender manualmente el switch

This article applies to This article does not apply to This article is not tied to any specific product. Not all product versions are identified in this article.

Symptoms

El resultado de Stack-Trace muestra solo 5 de 6 CPU en línea, debido a lo cual el switch estaba offline y no se volvió a cargar.
 
"show system reset-reason"
----- motivo de restablecimiento para el módulo 1 (del supervisor en la ranura 1) ---
1) En 65175 usecs después de Mar Oct 13 02:48:39 2020
Motivo: Kernel panic
Servicio:
    Version: 8.1(1a)
   
"show logging nvram"
2020 Oct 14 18:44:02.277 switch %SYSLOG-2-SYSTEM_MSG : Los registros del sistema no se registrarán en Logflash hasta que Logflash esté en línea
2020 Oct 14 18:44:05.851 switch %KERN-0-SYSTEM_MSG: [ 0.036807] Controladora host irq 55 - kernel
2020 Oct 14 18:44:05.880 switch %KERN-0-SYSTEM_MSG: [ 0.057612] Asigne el puerto raíz irq 55 - kernel
2020 Oct 14 18:44:05.881 switch %KERN-0-SYSTEM_MSG: [ 0.057633] Controladora host irq 54 - kernel
2020 Oct 14 18:44:05.883 switch %KERN-0-SYSTEM_MSG: [ 0.059007] Asignar puerto raíz irq 54 - kernel
2020 Oct 14 18:44:05.912 switch %KERN-0-SYSTEM_MSG: [ 0.774555] Habilitación de todos los dispositivos PCI -kernel'show

logging onboard module stack-trace'CPU 0
Call Trace:

[b0463bc4] do_raw_spin_lock+0xec/0x120(unreliable)
[b0698738] dev_watchdog+0x58/0x29c
[b04324c4] call_timer_fn+0x48/0xfc
[b0432770] run_timer_softirq+0x1f4/0x248
[b042af38] __do_softirq+0x16c/0x368
[b042b428] irq_exit+0x68/0x90
[b040a3c8] timer_interrupt+0x204/0x278
[b040f388] ret_from_except+0x0/0x18

CPU 1 Proceso: swapper/1 (pid 0)
Seguimiento de llamada:
[b04230a4] cpm_idle_wait+0x14/0x24(no confiable)
[b0469d4c] cpu_startup_entry+0x124/0x1e8
[b0410d78] start_secondary+0x1fc/0x200
[b0402234] start_secondary_47x+0x24/

0x48CPU 2 Proceso: sysinfo (pid 3855)
Call Trace:
[b0480d58] smp_call_function_many+0x268/0x274(unreliable)
[b04182f8] flush_tlb_mm+0x58/0x68
[b042532c] copy_process.part.69+0xbb0/0x11a0
[b0425a84] do_fork+0xd0/0x318
[b040ecac] ret_from_syscall+0x0/0x3c

CPU 3 Proceso: swapper/3 (pid 0)
Seguimiento de llamadas:
[b04230a4] cpm_idle_wait+0x14/0x24(no confiable)
[b0469d4c] cpu_startup_entry+0x124/0x1e8
[b0410d78] start_secondary+0x1fc/0x200
[b0402234] start_secondary_47x+0x24/0x48

CPU 4 Proceso: swapper/4 (pid 0)
Seguimiento de llamadas:
[b04230a4] cpm_idle_wait+0x14/0x24(poco confiable)
[b0469d4c] cpu_startup_entry+0x124/0x1e8
[b0410d78] start_secondary+0x1fc/0x200
[b0402234] start_secondary_47x+0x24/0x48

Cause

Una de las CPU estaba offline, lo que provocó que el switch se apagara.

Resolution

Corrección permanente:
  • Si las 6 CPU no están en línea, reemplace el switch y asegúrese de que el nuevo switch se ejecute en NX-OS v8.4 (1a) o posterior.
  • Si las 6 CPU están en línea, actualice el firmware a NX-OS v8.4(1a) o posterior para evitar que vuelvan a ocurrir.

Additional Information

Esto se aplica solo a los switches Cisco MDS-9396s

Affected Products

Connectrix MDS 9396S
Article Properties
Article Number: 000181486
Article Type: Solution
Last Modified: 07 Jan 2021
Version:  1
Find answers to your questions from other Dell users
Support Services
Check if your device is covered by Support Services.