Connectrix: Cisco MDS: Modul-Reset Systemfehlercode 0x42b8001e schwerwiegender Fehler.

Summary: Das Problem tritt auf, wenn das Modul zurückgesetzt wird und einige Anschlüsse in den Zustand "hw_Failure" wechseln. Der identifizierte Portbereich sollte in den Status "Hardwarefehler" versetzt werden, anstatt das gesamte Modul neu zu laden. Der Fehler "F16_PLDA_RETRY_MERR" ist ein Multibit-ECC-Fehler, ein nicht korrigierbarer Hardwarefehler. ...

This article applies to This article does not apply to This article is not tied to any specific product. Not all product versions are identified in this article.

Symptoms

Der spezifische Portbereich wechselt in den Status "hw_Failure":

`show interface brief`
-----------------------------------------------------------------------------------------
Interface  Vsan   Admin  Admin   Status       SFP    Oper  Oper   Port     Logical
                  Mode   Trunk                       Mode  Speed  Channel   Type
                         Mode                              (Gbps)
-----------------------------------------------------------------------------------------
fc9/41      1400   FX     off     hwFailure    swl   --     --     --       --       
fc9/42      1400   FX     off     hwFailure    swl   --     --     --       --       
fc9/43      1400   FX     off     hwFailure    swl   --     --     --       --       
fc9/44      1400   FX     off     hwFailure    swl   --     --     --       --       
fc9/45      1      FX     off     hwFailure    swl   --     --     --       --       
fc9/46      1      FX     off     hwFailure    swl   --     --     --       --       
fc9/47      1400   FX     off     hwFailure    swl   --     --     --       --       
fc9/48      1      E      on      hwFailure    swl   --     --     57       --    

Der Fehlercode wird im internen Ausnahmeprotokoll des Moduls wie folgt angezeigt:

`show module internal exceptionlog module 9`
********* Exception info for module 9 ********
exception information --- exception instance 1 ----
Module Slot Number: 9
Device Id         : 204
Device Name       : F16 Generic Driver
Device Errorcode  : 0xccc05600
Device ID         : 204 (0xcc)
Device Instance   : 05 (0x05)
Dev Type (HW/SW)  : 06 (0x06)
ErrNum (devInfo)  : 00 (0x00)
System Errorcode  : 0x42b8001e fatal error
Error Type        : FATAL error
PhyPortLayer      : Fibre Channel
Port(s) Affected  : fc9/41-48
Error Description : F16_PLDA_RETRY_MERR
DSAP              : 0 (0x0)
Time              : Mon Jan  6 22:22:32 2025
                    (Ticks: 677CAC08 jiffies)

Ein Zurücksetzen des Moduls wird in show logging nvram angezeigt:

`show logging nvram`
2025 Jan  6 22:22:32 WTXA19710H15 %MODULE-2-MOD_SOMEPORTS_FAILED: Module 9 (Serial number: JAE18280N1K) reported failure on ports fc9/41-48 (Fibre Channel) due to fatal error in device DEV_F16_CMN (device error 0xccc05600)
2025 Jan  6 22:22:33 WTXA19710H15 %CALLHOME-2-EVENT: PORT_FAILURE
`show logging log`
2025 Jan  6 22:22:32 WTXA19710H15 %MODULE-2-MOD_SOMEPORTS_FAILED: Module 9 (Serial number: JAE18280N1K) reported failure on ports fc9/41-48 (Fibre Channel) due to fatal error in device DEV_F16_CMN (device error 0xccc05600)
2025 Jan  6 22:22:32 WTXA19710H15 %PORT-CHANNEL-5-PORT_DOWN: port-channel57: fc9/48 is down
2025 Jan  6 22:22:33 WTXA19710H15 %PORT-5-IF_DOWN_HW_FAILURE: %$VSAN 1%$ Interface fc9/48 is down (Hardware Failure) port-channel57 ISL to WTXA19710C02 fc7/22 
2025 Jan  6 22:22:33 WTXA19710H15 %CALLHOME-2-EVENT: PORT_FAILURE
2025 Jan  6 22:22:33 WTXA19710H15 %PORT-5-IF_DOWN_HW_FAILURE: %$VSAN 1400%$ Interface fc9/47 is down (Hardware Failure)  ltx15brwccas01_h0 
2025 Jan  6 22:22:33 WTXA19710H15 %PORT-5-IF_DOWN_HW_FAILURE: %$VSAN 1%$ Interface fc9/46 is down (Hardware Failure)   
2025 Jan  6 22:22:33 WTXA19710H15 %PORT-5-IF_DOWN_HW_FAILURE: %$VSAN 1%$ Interface fc9/45 is down (Hardware Failure)   
2025 Jan  6 22:22:33 WTXA19710H15 %PORT-5-IF_DOWN_HW_FAILURE: %$VSAN 1400%$ Interface fc9/44 is down (Hardware Failure)   
2025 Jan  6 22:22:33 WTXA19710H15 %PORT-5-IF_DOWN_HW_FAILURE: %$VSAN 1400%$ Interface fc9/43 is down (Hardware Failure)   
2025 Jan  6 22:22:33 WTXA19710H15 %PORT-5-IF_DOWN_HW_FAILURE: %$VSAN 1400%$ Interface fc9/42 is down (Hardware Failure)  ltx14brwccas02_h0 
2025 Jan  6 22:22:33 WTXA19710H15 %PORT-5-IF_DOWN_HW_FAILURE: %$VSAN 1400%$ Interface fc9/41 is down (Hardware Failure)  ltx14brwccas01_h0 

 

Cause

Der DEV_F16_CMN Fehler auf einem Switch der Cisco MDS 9000 Serie weist in der Regel auf ein Hardwareproblem im Zusammenhang mit dem F16-ASIC hin. Dieser Fehler führt häufig dazu, dass das Modul aufgrund eines nicht behebbaren Multi-Bit-ECC-Fehlers (Error-Correcting Code) neu gestartet wird.

Resolution

Die einzige Möglichkeit, eine Schnittstelle von hw_Failure wiederherzustellen, besteht darin, das Modul durch Unterbrechung neu zu laden.

#reload module x

Wenn bei den Schnittstellen ein vorübergehender Hardwarefehler vorliegt, kann der Status durch Neuladen des Moduls wiederhergestellt werden. Wenn die Schnittstellen einen permanenten Hardwarefehler aufweisen, fahren Sie mit dem Austausch des Moduls fort.

 

WARNUNG: Die Aktivität ist störend und sollte während des Wartungszeitfensters durchgeführt werden.

 

Additional Information

SR #203555104 

Affected Products

Connectrix MDS-Series Hardware
Article Properties
Article Number: 000271449
Article Type: Solution
Last Modified: 03 Feb 2025
Version:  1
Find answers to your questions from other Dell users
Support Services
Check if your device is covered by Support Services.