Connectrix. Cisco MDS. Код системной ошибки сброса модуля 0x42b8001e неустранимая ошибка.
Summary: Проблема возникает, когда модуль сбрасывается и несколько портов переходят в состояние «hw_Failure». Конкретный диапазон портов должен быть переведен в состояние «Сбой оборудования», но вместо перезагрузки всего модуля. Ошибка «F16_PLDA_RETRY_MERR» — это многобитовая ошибка ECC, неустранимый аппаратный сбой. ...
This article applies to
This article does not apply to
This article is not tied to any specific product.
Not all product versions are identified in this article.
Symptoms
Конкретный диапазон портов переходит в состояние «hw_Failure»:
`show interface brief` ----------------------------------------------------------------------------------------- Interface Vsan Admin Admin Status SFP Oper Oper Port Logical Mode Trunk Mode Speed Channel Type Mode (Gbps) ----------------------------------------------------------------------------------------- fc9/41 1400 FX off hwFailure swl -- -- -- -- fc9/42 1400 FX off hwFailure swl -- -- -- -- fc9/43 1400 FX off hwFailure swl -- -- -- -- fc9/44 1400 FX off hwFailure swl -- -- -- -- fc9/45 1 FX off hwFailure swl -- -- -- -- fc9/46 1 FX off hwFailure swl -- -- -- -- fc9/47 1400 FX off hwFailure swl -- -- -- -- fc9/48 1 E on hwFailure swl -- -- 57 --
Код ошибки отображается во внутреннем журнале исключений модуля, как показано ниже:
`show module internal exceptionlog module 9`
********* Exception info for module 9 ********
exception information --- exception instance 1 ----
Module Slot Number: 9
Device Id : 204
Device Name : F16 Generic Driver
Device Errorcode : 0xccc05600
Device ID : 204 (0xcc)
Device Instance : 05 (0x05)
Dev Type (HW/SW) : 06 (0x06)
ErrNum (devInfo) : 00 (0x00)
System Errorcode : 0x42b8001e fatal error
Error Type : FATAL error
PhyPortLayer : Fibre Channel
Port(s) Affected : fc9/41-48
Error Description : F16_PLDA_RETRY_MERR
DSAP : 0 (0x0)
Time : Mon Jan 6 22:22:32 2025
(Ticks: 677CAC08 jiffies)
Сброс модуля показан в разделе show logging nvram:
`show logging nvram` 2025 Jan 6 22:22:32 WTXA19710H15 %MODULE-2-MOD_SOMEPORTS_FAILED: Module 9 (Serial number: JAE18280N1K) reported failure on ports fc9/41-48 (Fibre Channel) due to fatal error in device DEV_F16_CMN (device error 0xccc05600) 2025 Jan 6 22:22:33 WTXA19710H15 %CALLHOME-2-EVENT: PORT_FAILURE
`show logging log` 2025 Jan 6 22:22:32 WTXA19710H15 %MODULE-2-MOD_SOMEPORTS_FAILED: Module 9 (Serial number: JAE18280N1K) reported failure on ports fc9/41-48 (Fibre Channel) due to fatal error in device DEV_F16_CMN (device error 0xccc05600) 2025 Jan 6 22:22:32 WTXA19710H15 %PORT-CHANNEL-5-PORT_DOWN: port-channel57: fc9/48 is down 2025 Jan 6 22:22:33 WTXA19710H15 %PORT-5-IF_DOWN_HW_FAILURE: %$VSAN 1%$ Interface fc9/48 is down (Hardware Failure) port-channel57 ISL to WTXA19710C02 fc7/22 2025 Jan 6 22:22:33 WTXA19710H15 %CALLHOME-2-EVENT: PORT_FAILURE 2025 Jan 6 22:22:33 WTXA19710H15 %PORT-5-IF_DOWN_HW_FAILURE: %$VSAN 1400%$ Interface fc9/47 is down (Hardware Failure) ltx15brwccas01_h0 2025 Jan 6 22:22:33 WTXA19710H15 %PORT-5-IF_DOWN_HW_FAILURE: %$VSAN 1%$ Interface fc9/46 is down (Hardware Failure) 2025 Jan 6 22:22:33 WTXA19710H15 %PORT-5-IF_DOWN_HW_FAILURE: %$VSAN 1%$ Interface fc9/45 is down (Hardware Failure) 2025 Jan 6 22:22:33 WTXA19710H15 %PORT-5-IF_DOWN_HW_FAILURE: %$VSAN 1400%$ Interface fc9/44 is down (Hardware Failure) 2025 Jan 6 22:22:33 WTXA19710H15 %PORT-5-IF_DOWN_HW_FAILURE: %$VSAN 1400%$ Interface fc9/43 is down (Hardware Failure) 2025 Jan 6 22:22:33 WTXA19710H15 %PORT-5-IF_DOWN_HW_FAILURE: %$VSAN 1400%$ Interface fc9/42 is down (Hardware Failure) ltx14brwccas02_h0 2025 Jan 6 22:22:33 WTXA19710H15 %PORT-5-IF_DOWN_HW_FAILURE: %$VSAN 1400%$ Interface fc9/41 is down (Hardware Failure) ltx14brwccas01_h0
Cause
Ошибка DEV_F16_CMN на коммутаторе Cisco MDS серии 9000 обычно указывает на аппаратную проблему, связанную с F16 ASIC. Эта ошибка часто приводит к перезагрузке модуля из-за неустранимой многоразрядной ошибки кода коррекции ошибок (ECC).
Resolution
Единственный способ восстановить интерфейс из hw_Failure — перезагрузить модуль с помощью прерывания работы.
#reload module x
В случае временного аппаратного сбоя интерфейсов состояние можно восстановить путем перезагрузки модуля. Если в интерфейсах произошел неустранимый аппаратный сбой, замените модуль.
ПРЕДУПРЕЖДЕНИЕ. Это действие требует прерывания работы и должно выполняться в период обслуживания.
Additional Information
СР #203555104
Affected Products
Connectrix MDS-Series HardwareArticle Properties
Article Number: 000271449
Article Type: Solution
Last Modified: 03 Feb 2025
Version: 1
Find answers to your questions from other Dell users
Support Services
Check if your device is covered by Support Services.