Connectrix : Cisco MDS9700 DS-X9448-768K9 : Échec de liaison Échec de la réinitialisation de lien Erreurs de file d’attente d’enregistrement non vide observées après l’échec du port

Summary: Cisco MDS9700 DS-X9448-768K9 : Échec de liaison Échec de la réinitialisation de lien Erreurs de file d’attente de réception non vide rencontrées après hwfailure du port.

This article applies to This article does not apply to This article is not tied to any specific product. Not all product versions are identified in this article.

Symptoms

  • Les ports 9 à 12 sur le deuxième ASIC d’un LC ont échoué avec des erreurs hwfailure. Les ports fc13-16 (également sur le même ASIC) abandonnaient des paquets, provoquant une congestion sur le commutateur, mais ces ports (13-16) ne s’affichaient pas comme défaillants.
  • La carte de ligne concernée est un module FC avancé 48 ports 16 Gbit/s (DS-X9448-768K9)

 

Cause

Ce problème est dû au problème suivant :
CSCuw59045Ce lien hypertexte renvoie à un site Web extérieur à Dell Technologies.> MDS9700 DS-X9448-768K9 : la perte de synchronisation xbar doit faire échouer les huit ports.

Symptôme:
Après une défaillance matérielle interne, une corruption ou des pertes de trame, ou les deux, se produisent sur un bloc de quatre ports. Le message syslog suivant indique la panne matérielle :

Exemple de défaillance matérielle de la liaison de port/structure ASIC :

MODULE-4-MOD_WARNING: Module 4 (Serial number: JAE180605XF) reported warning fc4/9-12due to SAC sync lost in device DEV_LOCAL_SAC_ASIC (device error 0xc9101200)

CALLHOME-2-EVENT: MODULE_WARNING

MODULE-2-MOD_SOMEPORTS_FAILED: Module 4 (Serial number: JAE180605XF) reported failure on ports fc4/9-12 (Fibre Channel) due to Local serial link syncing exception in device DEV_LOCAL_SAC_ASIC (device error 0xc9101204)

Les erreurs suivantes de défaillance matérielle du port sont consignées :

PORT-5-IF_DOWN_HW_FAILURE: %$VSAN 101%$ Interface fc4/12 is down (Hardware Failure)  vmax

CALLHOME-2-EVENT: PORT_FAILURE

PORT-5-IF_DOWN_HW_FAILURE: %$VSAN 101%$ Interface fc4/11 is down (Hardware Failure)  server1

PORT-5-IF_DOWN_HW_FAILURE: %$VSAN 101%$ Interface fc4/10 is down (Hardware Failure)  server2

PORT-5-IF_DOWN_HW_FAILURE: %$VSAN 1%$ Interface fc4/9 is down (Hardware Failure)  ISL

Lorsque cette défaillance se produit, seuls quatre ports au lieu des huit ports de l’ASIC de port concerné sont définis sur l’état « hwFailure » par NX-OS. Les quatre autres ports concernés restent activés, mais se comportent comme des orifices de vidage lents. Lorsque cela se produit, show logging onboard enregistre l’incrémentation des compteurs suivants :

fc1/5 |F16_TMM_TOLB_TIMEOUT_DROP_CNT |13025 |01/01/16

D’autres symptômes incluent des réinitialisations de liens et des échecs de réinitialisation de liens sur des interfaces non liées. Ces erreurs sont causées par le trafic destiné aux quatre ports qui n’ont pas été désactivés.

PORT-5-IF_DOWN_LINK_FAILURE: %$VSAN 101%$ Interface fc8/47 is down (Link failure Link Reset failed nonempty recv queue) server3

VSAN 101%$ Interface fc8/32 is down (Link failure Link Reset failed nonempty recv queue)  server4

Conditions:
Ce problème se produit uniquement sur la carte de ligne MDS 9700 DS-X9448-768K9 après une défaillance de liaison de fabric interne.

Remarque : Le message LR Rcvd B2B (ou Link failure Link Reset failed Link Reset failed nonempty recv queue) indique que le périphérique rattaché au port transmet une réinitialisation de liaison (LR) au MDS, mais que le MDS ne répond pas avec une réponse de réinitialisation de lien (LRR) en raison d’un encombrement interne sur le port. Le port contient des paquets en file d’attente reçus du périphérique connecté, mais le MDS ne peut pas les acheminer vers le port de sortie approprié. Puisqu’elles sont toujours en file d’attente au niveau du port d’entrée, le MDS ne peut pas renvoyer de LRR et la liaison échoue.

 

Resolution

  • Vérifiez si seulement quatre des huit ports de l’ASIC affichent une erreur matérielle
  • Vérifiez si les erreurs « Link failure Link Reset failed nonempty recv queue » sont diffusées pour les autres interfaces. Ces erreurs de port sont le symptôme d’un encombrement du commutateur et non la cause première

Solution de contournement :
Étape 1 - Arrêtez manuellement les quatre ports restants sur l’ASIC défectueux pour éviter la perte ou la corruption des données.

Regroupements de ports Gen 5 : (x est le numéro de logement LC concerné)

fcx/1-8
fcx/9-16
fcx/17-24
fcx/25-32
fcx/33-40
fcx/41-48

Étape 2 : remplacez la carte de ligne concernée.

 

Additional Information

Versions concernées connues :

  • 6.2(1)
  • 6.2(11)
  • 6.2(11a)
  • 6.2(11b)
  • 6.2(11c)
  • 6.2(11d)
  • 6.2(13)
  • 6.2(13a)
  • 6.2(3)
  • 6.2(5)
  • 6.2(7)
  • 6.2(9)
  • 6.2(9a)
  • 6.2(9b)
  • 6.2(9c)

Contactez le support Dell pour une solution de contournement préventive du problème.

 

Affected Products

Connectrix MDS-9710

Products

Connectrix MDS-9710, Connectrix MDS-Series Firmware 6.X
Article Properties
Article Number: 000064449
Article Type: Solution
Last Modified: 08 Dec 2025
Version:  5
Find answers to your questions from other Dell users
Support Services
Check if your device is covered by Support Services.