Connectrix: Cisco MDS: 모듈 재설정 시스템 오류 코드 0x42b8001e 치명적인 오류입니다.

Summary: 이 문제는 모듈이 재설정되고 일부 포트가 "hw_Failure" 상태로 전환되는 경우에 나타납니다. 식별된 특정 포트 범위는 전체 모듈이 다시 로드되는 대신 하드웨어 오류 상태로 전환되어야 합니다. "F16_PLDA_RETRY_MERR" 오류는 다중 비트 ECC 오류, 수정 불가능한 하드웨어 장애입니다.

This article applies to This article does not apply to This article is not tied to any specific product. Not all product versions are identified in this article.

Symptoms

특정 포트 범위가 "hw_Failure" 상태가 됩니다.

`show interface brief`
-----------------------------------------------------------------------------------------
Interface  Vsan   Admin  Admin   Status       SFP    Oper  Oper   Port     Logical
                  Mode   Trunk                       Mode  Speed  Channel   Type
                         Mode                              (Gbps)
-----------------------------------------------------------------------------------------
fc9/41      1400   FX     off     hwFailure    swl   --     --     --       --       
fc9/42      1400   FX     off     hwFailure    swl   --     --     --       --       
fc9/43      1400   FX     off     hwFailure    swl   --     --     --       --       
fc9/44      1400   FX     off     hwFailure    swl   --     --     --       --       
fc9/45      1      FX     off     hwFailure    swl   --     --     --       --       
fc9/46      1      FX     off     hwFailure    swl   --     --     --       --       
fc9/47      1400   FX     off     hwFailure    swl   --     --     --       --       
fc9/48      1      E      on      hwFailure    swl   --     --     57       --    

오류 코드는 아래와 같이 모듈 내부 예외 로그에 표시됩니다.

`show module internal exceptionlog module 9`
********* Exception info for module 9 ********
exception information --- exception instance 1 ----
Module Slot Number: 9
Device Id         : 204
Device Name       : F16 Generic Driver
Device Errorcode  : 0xccc05600
Device ID         : 204 (0xcc)
Device Instance   : 05 (0x05)
Dev Type (HW/SW)  : 06 (0x06)
ErrNum (devInfo)  : 00 (0x00)
System Errorcode  : 0x42b8001e fatal error
Error Type        : FATAL error
PhyPortLayer      : Fibre Channel
Port(s) Affected  : fc9/41-48
Error Description : F16_PLDA_RETRY_MERR
DSAP              : 0 (0x0)
Time              : Mon Jan  6 22:22:32 2025
                    (Ticks: 677CAC08 jiffies)

show logging nvram에 모듈 재설정이 표시됩니다.

`show logging nvram`
2025 Jan  6 22:22:32 WTXA19710H15 %MODULE-2-MOD_SOMEPORTS_FAILED: Module 9 (Serial number: JAE18280N1K) reported failure on ports fc9/41-48 (Fibre Channel) due to fatal error in device DEV_F16_CMN (device error 0xccc05600)
2025 Jan  6 22:22:33 WTXA19710H15 %CALLHOME-2-EVENT: PORT_FAILURE
`show logging log`
2025 Jan  6 22:22:32 WTXA19710H15 %MODULE-2-MOD_SOMEPORTS_FAILED: Module 9 (Serial number: JAE18280N1K) reported failure on ports fc9/41-48 (Fibre Channel) due to fatal error in device DEV_F16_CMN (device error 0xccc05600)
2025 Jan  6 22:22:32 WTXA19710H15 %PORT-CHANNEL-5-PORT_DOWN: port-channel57: fc9/48 is down
2025 Jan  6 22:22:33 WTXA19710H15 %PORT-5-IF_DOWN_HW_FAILURE: %$VSAN 1%$ Interface fc9/48 is down (Hardware Failure) port-channel57 ISL to WTXA19710C02 fc7/22 
2025 Jan  6 22:22:33 WTXA19710H15 %CALLHOME-2-EVENT: PORT_FAILURE
2025 Jan  6 22:22:33 WTXA19710H15 %PORT-5-IF_DOWN_HW_FAILURE: %$VSAN 1400%$ Interface fc9/47 is down (Hardware Failure)  ltx15brwccas01_h0 
2025 Jan  6 22:22:33 WTXA19710H15 %PORT-5-IF_DOWN_HW_FAILURE: %$VSAN 1%$ Interface fc9/46 is down (Hardware Failure)   
2025 Jan  6 22:22:33 WTXA19710H15 %PORT-5-IF_DOWN_HW_FAILURE: %$VSAN 1%$ Interface fc9/45 is down (Hardware Failure)   
2025 Jan  6 22:22:33 WTXA19710H15 %PORT-5-IF_DOWN_HW_FAILURE: %$VSAN 1400%$ Interface fc9/44 is down (Hardware Failure)   
2025 Jan  6 22:22:33 WTXA19710H15 %PORT-5-IF_DOWN_HW_FAILURE: %$VSAN 1400%$ Interface fc9/43 is down (Hardware Failure)   
2025 Jan  6 22:22:33 WTXA19710H15 %PORT-5-IF_DOWN_HW_FAILURE: %$VSAN 1400%$ Interface fc9/42 is down (Hardware Failure)  ltx14brwccas02_h0 
2025 Jan  6 22:22:33 WTXA19710H15 %PORT-5-IF_DOWN_HW_FAILURE: %$VSAN 1400%$ Interface fc9/41 is down (Hardware Failure)  ltx14brwccas01_h0 

 

Cause

Cisco MDS 9000 Series 스위치의 DEV_F16_CMN 오류는 일반적으로 F16 ASIC와 관련된 하드웨어 문제를 나타냅니다. 이 오류는 복구할 수 없는 다중 비트 ECC(Error-Correcting Code) 오류로 인해 모듈이 재부팅되는 경우가 많습니다.

Resolution

hw_Failure에서 인터페이스를 복구하는 유일한 방법은 중단을 일으키며 모듈을 다시 로드하는 것입니다.

#reload module x

인터페이스에 일시적인 하드웨어 장애가 발생한 경우 모듈 재로드를 통해 상태를 복구할 수 있습니다. 인터페이스에 영구적인 하드웨어 장애가 있는 경우 모듈 교체를 진행합니다.

 

경고: 이 작업은 중단을 유발하므로 유지 보수 기간 중에 수행해야 합니다.

 

Additional Information

SR #203555104 

Affected Products

Connectrix MDS-Series Hardware
Article Properties
Article Number: 000271449
Article Type: Solution
Last Modified: 03 Feb 2025
Version:  1
Find answers to your questions from other Dell users
Support Services
Check if your device is covered by Support Services.