Connectrix: Cisco MDS: Il codice di errore del sistema di reimpostazione del modulo 0x42b8001e errore irreversibile.
Summary: Il problema si verifica quando il modulo si reimposta e alcune porte entrano in stato "hw_Failure". L'intervallo di porte specifico identificato deve essere impostato sullo stato di errore hardware, ma invece di ricaricare l'intero modulo. L'errore "F16_PLDA_RETRY_MERR" è un errore ECC multibit, un guasto hardware non correggibile. ...
Symptoms
L'intervallo di porte specifico passa allo stato "hw_Failure":
`show interface brief` ----------------------------------------------------------------------------------------- Interface Vsan Admin Admin Status SFP Oper Oper Port Logical Mode Trunk Mode Speed Channel Type Mode (Gbps) ----------------------------------------------------------------------------------------- fc9/41 1400 FX off hwFailure swl -- -- -- -- fc9/42 1400 FX off hwFailure swl -- -- -- -- fc9/43 1400 FX off hwFailure swl -- -- -- -- fc9/44 1400 FX off hwFailure swl -- -- -- -- fc9/45 1 FX off hwFailure swl -- -- -- -- fc9/46 1 FX off hwFailure swl -- -- -- -- fc9/47 1400 FX off hwFailure swl -- -- -- -- fc9/48 1 E on hwFailure swl -- -- 57 --
Il codice errore viene visualizzato nel registro interno delle eccezioni del modulo come indicato di seguito:
`show module internal exceptionlog module 9`
********* Exception info for module 9 ********
exception information --- exception instance 1 ----
Module Slot Number: 9
Device Id : 204
Device Name : F16 Generic Driver
Device Errorcode : 0xccc05600
Device ID : 204 (0xcc)
Device Instance : 05 (0x05)
Dev Type (HW/SW) : 06 (0x06)
ErrNum (devInfo) : 00 (0x00)
System Errorcode : 0x42b8001e fatal error
Error Type : FATAL error
PhyPortLayer : Fibre Channel
Port(s) Affected : fc9/41-48
Error Description : F16_PLDA_RETRY_MERR
DSAP : 0 (0x0)
Time : Mon Jan 6 22:22:32 2025
(Ticks: 677CAC08 jiffies)
Viene visualizzato un ripristino del modulo in show logging nvram:
`show logging nvram` 2025 Jan 6 22:22:32 WTXA19710H15 %MODULE-2-MOD_SOMEPORTS_FAILED: Module 9 (Serial number: JAE18280N1K) reported failure on ports fc9/41-48 (Fibre Channel) due to fatal error in device DEV_F16_CMN (device error 0xccc05600) 2025 Jan 6 22:22:33 WTXA19710H15 %CALLHOME-2-EVENT: PORT_FAILURE
`show logging log` 2025 Jan 6 22:22:32 WTXA19710H15 %MODULE-2-MOD_SOMEPORTS_FAILED: Module 9 (Serial number: JAE18280N1K) reported failure on ports fc9/41-48 (Fibre Channel) due to fatal error in device DEV_F16_CMN (device error 0xccc05600) 2025 Jan 6 22:22:32 WTXA19710H15 %PORT-CHANNEL-5-PORT_DOWN: port-channel57: fc9/48 is down 2025 Jan 6 22:22:33 WTXA19710H15 %PORT-5-IF_DOWN_HW_FAILURE: %$VSAN 1%$ Interface fc9/48 is down (Hardware Failure) port-channel57 ISL to WTXA19710C02 fc7/22 2025 Jan 6 22:22:33 WTXA19710H15 %CALLHOME-2-EVENT: PORT_FAILURE 2025 Jan 6 22:22:33 WTXA19710H15 %PORT-5-IF_DOWN_HW_FAILURE: %$VSAN 1400%$ Interface fc9/47 is down (Hardware Failure) ltx15brwccas01_h0 2025 Jan 6 22:22:33 WTXA19710H15 %PORT-5-IF_DOWN_HW_FAILURE: %$VSAN 1%$ Interface fc9/46 is down (Hardware Failure) 2025 Jan 6 22:22:33 WTXA19710H15 %PORT-5-IF_DOWN_HW_FAILURE: %$VSAN 1%$ Interface fc9/45 is down (Hardware Failure) 2025 Jan 6 22:22:33 WTXA19710H15 %PORT-5-IF_DOWN_HW_FAILURE: %$VSAN 1400%$ Interface fc9/44 is down (Hardware Failure) 2025 Jan 6 22:22:33 WTXA19710H15 %PORT-5-IF_DOWN_HW_FAILURE: %$VSAN 1400%$ Interface fc9/43 is down (Hardware Failure) 2025 Jan 6 22:22:33 WTXA19710H15 %PORT-5-IF_DOWN_HW_FAILURE: %$VSAN 1400%$ Interface fc9/42 is down (Hardware Failure) ltx14brwccas02_h0 2025 Jan 6 22:22:33 WTXA19710H15 %PORT-5-IF_DOWN_HW_FAILURE: %$VSAN 1400%$ Interface fc9/41 is down (Hardware Failure) ltx14brwccas01_h0
Cause
L'errore DEV_F16_CMN su uno switch Cisco MDS serie 9000 indica in genere un problema hardware correlato all'ASIC F16. Questo errore spesso comporta il riavvio del modulo a causa di un errore ECC (Error-Correcting Code) multibit irreversibile.
Resolution
L'unico modo per ripristinare un'interfaccia da hw_Failure consiste nel ricaricare il modulo con interruzione.
#reload module x
Se le interfacce sono interessate da un guasto hardware temporaneo, lo stato è ripristinabile ricaricando il modulo. Se si verifica un errore hardware permanente nelle interfacce, procedere con la sostituzione del modulo.
Additional Information
SR #203555104