Connectrix : Dépannage des problèmes de communication du nœud Fibre Channel au port du commutateur ou du SFP par élimination, auto-assistance (en anglais).
Summary: Cet article explique comment résoudre les problèmes de communication entre le nœud Fibre Channel et le port de commutation ou SFP par élimination.
Symptoms
Comment résoudre les problèmes de communication entre le nœud Fibre Channel et le port du commutateur ou le SFP par élimination ?
Trop de remplacements SFP proactifs Défaillance
de liaison Port
G Pas de voyant
Séquence non opérationnelle (NOS)Séquence hors ligne (OLS)
Perte de signal
SFP
défectueux Dépannage des erreurs de port
FC sur le port FC
Cause
Trop de SFP sont remplacés de manière proactive alors que le problème se situe en dehors du SFP ou du commutateur.
Resolution
Pour résoudre ce problème :
- Identifiez le nœud et le port du commutateur impliqués dans l’échec de communication.
- Vérifiez que le port du commutateur est administrativement actif (débloqué, non fermé) ou activé.
- Assurez-vous qu’il existe des chemins redondants disponibles vers le périphérique connecté avant de continuer.
- Pour éliminer le SFP du problème, procédez comme suit :
- Vérifiez le port libre sur le commutateur.
- Désactivez le port libre identifié sur le commutateur.
- Déplacez le câble du port qui doit être examiné vers le nouveau port libre désactivé à l’étape précédente.
- Modifiez le port désactivé pour activer l’état (ou le porter administrativement) et remettez l’appareil en ligne.
- Effacer/remettre les statistiques/compteurs à zéro sur le commutateur.
Pour Brocade, consultez l’article de la base de connaissances :
Pour Cisco, consultez l’article de la base de connaissances :
Connectrix - MDS Series Cisco : Comment effacer les compteurs d’interface et ASIC sur un MDS
- Surveillez le port avec les commandes respectives pendant 4 à 6 heures.
RÉSULTATS:
- Si le nombre de compteurs d’erreurs augmente, le problème provient de l’extérieur du commutateur et l’administrateur client/utilisateur/SAN doit être informé qu’il doit :
-
- Le nouveau port SFP et le câble doivent être nettoyés. (Pour éviter toute contamination du SFP d’un câble sale, pensez à utiliser un kit de nettoyage professionnel.)
- Le périphérique connecté doit faire l’objet d’un examen plus approfondi par la personne qui prend en charge le périphérique.
- Sur le commutateur Cisco, si l’état « errdisabled » revient sans augmentation du compteur, une demande de service doit être ouverte pour une enquête back-end plus approfondie.
- Si les erreurs n’augmentent pas (ou si l’état Errdisabled sur le commutateur Cisco ne revient pas), le SFP sur le port précédent est défectueux, ouvrez une demande de service pour le remplacement du SFP en fournissant les résultats d’analyse ci-dessus, y compris les sorties de log, les détails du SFP (SM ou MM, vitesse, etc.)
Additional Information
Les défaillances matérielles peuvent facilement être isolées en appliquant un algorithme simple au problème ; S’il ne s’agit pas de ce composant matériel, il s’agit de l’autre élément. Répétez cette étape jusqu’à ce que vous ayez isolé la défaillance pointant vers le matériel problématique.
EXEMPLES BROCADE :
Connectrix B-Series : interprétation du résultat de la commande Brocade porterrshow et signification des compteurs (en anglais). Autoassistance
Exemple 1 : ENC OUT avec LINK FAIL et LOSS SYNC :
porterrshow : CURRENT CONTEXT -- 3 , 111 frames enc crc crc too too bad enc disc link loss loss frjt fbsy c3timeout pcs tx rx in err g_eof shrt long eof out c3 fail sync sig tx rx err xx: 849.1k 493.2k 0 0 0 0 0 0 2.3m 0 4 6 0 0 0 0 0 0
Motif général :
valide uniquement si les statistiques des ports ont été effacées au cours des dernières 24 heures. Sinon, classez ces compteurs comme historiques. Effacez les statistiques des ports (comme indiqué ci-dessus au point 9) et vérifiez les compteurs et reprenez les données après 4 à 6 heures.
À partir des erreurs, nous pouvons voir l’échec du lien et la perte de synchronisation PLUS des erreurs d’enfichage, celles-ci peuvent également inclure une erreur
de perte.Ces combinaisons d’erreurs indiquent généralement un redémarrage de l’hôte ou une réinitialisation de liaison externe au commutateur. Les erreurs d’enc out sont provoquées lors de la négociation de vitesse dans le cadre d’une initialisation de liaison.
Actions attendues :
Vérifiez que le périphérique connecté au port avait une raison légitime de se déconnecter et/ou de se connecter. Par exemple, le redémarrage de l’hôte. Si ce n’est pas le cas, créez une demande de service.
Exemple 2 : ENC OUT :
porterrshow : CURRENT CONTEXT -- 3 , 111 frames enc crc crc too too bad enc disc link loss loss frjt fbsy c3timeout pcs tx rx in err g_eof shrt long eof out c3 fail sync sig tx rx err xx: 849.1k 493.2k 0 0 0 0 0 0 2.3m 0 0 0 0 0 0 0 0 0
Motif général :
valide uniquement si les statistiques des ports ont été effacées au cours des dernières 24 heures. Sinon, classez ces compteurs comme historiques. Effacez les statistiques des ports (comme indiqué ci-dessus au point 9) et vérifiez les compteurs et reprenez les données après 4 à 6 heures.
Les erreurs d’enlèvement sans erreurs associées indiquent que le câble est sale.
Actions attendues :
inspectez et nettoyez toutes les faces optiques du câble et du SFP connectés à ce port et aux périphériques qui y sont connectés.
Exemple 3 CRC et CRC G_EOF :
porterrshow : CURRENT CONTEXT -- 3 , 111 frames enc crc crc too too bad enc disc link loss loss frjt fbsy c3timeout pcs tx rx in err g_eof shrt long eof out c3 fail sync sig tx rx err xx: 849.1k 493.2k 0 1.2k 1.2k 0 0 0 0 0 0 0 0 0 0 0 0 0
Motif général :
valide uniquement si les statistiques des ports ont été effacées au cours des dernières 24 heures. Sinon, classez ces compteurs comme historiques. Effacez les statistiques des ports (comme indiqué ci-dessus au point 9) et vérifiez les compteurs et reprenez les données après 4 à 6 heures.
La trame entre dans le port du commutateur avec un CRC incorrect, mais la fin de la trame est toujours marquée comme correcte.
Cela indique qu’il s’agit du premier port à enregistrer la trame défectueuse et que le problème provient donc de l’interface SFP/câble/périphérique connecté sur ce port spécifique.
Actions attendues :
Voir l’action par défaut dans la résolution.
Pour un port ISL, effacez les statistiques (comme indiqué ci-dessus au point 9), vérifiez les compteurs et reprenez les données après 4 à 6 heures, collectez les sauvegardes de support des deux commutateurs et ouvrez la demande de service pour un dépannage normal.
Exemple 4 CRC :
porterrshow : CURRENT CONTEXT -- 3 , 111 frames enc crc crc too too bad enc disc link loss loss frjt fbsy c3timeout pcs tx rx in err g_eof shrt long eof out c3 fail sync sig tx rx err xx: 849.1k 493.2k 0 1.2k 0 0 0 0 0 0 0 0 0 0 0 0 0 0
Motif général :
valide uniquement si les statistiques des ports ont été effacées au cours des dernières 24 heures. Sinon, classez ces compteurs comme historiques. Effacez les statistiques des ports (comme indiqué ci-dessus au point 9) et vérifiez les compteurs et reprenez les données après 4 à 6 heures.
Le port enregistre une trame entrant dans le commutateur avec une trame CRC incorrecte, mais avec la trame déjà marquée comme défectueuse. Normalement, cela se voit sur les ports F ISL et NPIV.
Actions attendues :
si des erreurs CRC se connectent sur le port NPIV, faites examiner l’appareil par le fournisseur de maintenance !
Pour un port ISL, vérifiez tous les ports de la structure à la recherche d’une g_oef et d’une action crc de consignation de port, comme dans l’exemple 3.
Exemple 5 ERR PCS avec ÉCHEC DE LIAISON ET SYNCHRONISATION DES PERTES :
porterrshow : CURRENT CONTEXT -- 3 , 111 frames enc crc crc too too bad enc disc link loss loss frjt fbsy c3timeout pcs tx rx in err g_eof shrt long eof out c3 fail sync sig tx rx err xx: 849.1k 493.2k 0 0 0 0 0 0 0 0 4 4 0 0 0 0 0 466
Motif général :
valide uniquement si les statistiques des ports ont été effacées au cours des dernières 24 heures. Sinon, classez ces compteurs comme historiques. Effacez les statistiques des ports (comme indiqué ci-dessus au point 9) et vérifiez les compteurs et reprenez les données après 4 à 6 heures.
Cela s’applique uniquement aux plates-formes qui prennent en charge les ports 10 Gbit/s ou 16 Gbit/s et plus (6505/6510/6520/DCX-8510) et a été introduit avec l’ASIC Condor3, la plate-forme GEN5.
ER_PCS_BLK indique le nombre d’erreurs de bloc de sous-couche de codage physique (PCS). Ce compteur est équivalent à enc_out pour une liaison 8 Go/4 Go et est utilisé uniquement pour les vitesses de 10 Go et 16 Go et plus.
À partir des erreurs, nous pouvons voir l’échec du lien et la perte de synchronisation ainsi que les erreurs d’erreur pcs, celles-ci peuvent également inclure une erreur de signature d’erreur de perte.
Ces combinaisons d’erreurs indiquent généralement un redémarrage de l’hôte ou une réinitialisation de lien externe au commutateur.
Les erreurs d’erreur du PC sont causées lors de la négociation de vitesse dans le cadre de l’initialisation de la liaison.
Actions attendues :
Vérifiez que le périphérique connecté au port avait une raison légitime de se déconnecter et/ou de se connecter. Par exemple, le redémarrage de l’hôte. Si ce n’est pas le cas, ouvrez une demande de service.
Exemple 6 ERR PCS :
porterrshow : CURRENT CONTEXT -- 3 , 111 frames enc crc crc too too bad enc disc link loss loss frjt fbsy c3timeout pcs tx rx in err g_eof shrt long eof out c3 fail sync sig tx rx err xx: 849.1k 493.2k 0 0 0 0 0 0 0 0 0 0 0 0 0 0 0 466
Motif général :
valide uniquement si les statistiques des ports ont été effacées au cours des dernières 24 heures. Sinon, classez ces compteurs comme historiques. Effacez les statistiques des ports (comme indiqué ci-dessus au point 9) et vérifiez les compteurs et reprenez les données après 4 à 6 heures.
Des erreurs PCS ERR sans erreurs associées indiquent que le câble est sale.
Actions attendues :
inspectez et nettoyez toutes les faces optiques du câble et du SFP connectés à ce port et aux périphériques qui y sont connectés.
EXEMPLES CISCO :
Exemple 1 Errdisabled :
Errdisabled : aucune erreur d’interface n’est incrémentée
fc1/1 is down (Error disabled - bit error rate too high) Hardware is Fibre Channel, SFP is short wave laser w/o OFC (SN). 5 minutes input rate 0 bits/sec, 0 bytes/sec, 0 frames/sec 5 minutes output rate 0 bits/sec, 0 bytes/sec, 0 frames/sec 179 frames input, 7668 bytes 0 discards, 0 errors 0 CRC, 0 unknown class 0 too long, 0 too short 23 frames output, 1320 bytes 0 discards, 0 errors 1 input OLS, 1 LRR, 0 NOS, 1 loop inits 2 output OLS, 0 LRR, 0 NOS, 1 loop inits Interface last changed at Thu Jun 5 01:51:00 2014
Motif général :
L’état « Errdisabled » d’une interface peut être un peu trompeur car les compteurs d’interface peuvent être propres sur le front-end et le commutateur semble fermer le port avec l’état « errdisabled », et les compteurs d’erreurs augmentent sur le back-end (ASIC / interne / carte de ligne).
Actions attendues :
Voir l’action par défaut dans la résolution. Si cela se reproduit, collectez les informations de support technique et ouvrez la demande de service.
- Câble défectueux ou défectueux
- SFP défectueux ou défectueux
- Le SFP est conçu pour fonctionner à 1 Gbit/s, mais il est utilisé à 2 Gbit/s.
- Le SFP est conçu pour fonctionner à 2 Gbit/s, mais il est utilisé à 4 Gbit/s.
- Le câble courte distance est utilisé pour les longues distances, ou le câble longue distance est utilisé pour les courtes distances.
- Perte momentanée de la synchronisation
- Connexion de câble lâche à une extrémité ou aux deux extrémités
- Connexion SFP incorrecte à une ou aux deux extrémités
Un seuil de taux d’erreurs binaires est détecté lorsque 15 rafales d’erreurs se produisent sur une période de 5 minutes. Par défaut, le commutateur désactive l’interface lorsque le seuil est atteint. Vous pouvez saisir les commandes ci-dessous dans l’ordre pour réactiver l’interface.
shutdown
no shutdown Vous pouvez configurer le commutateur pour qu’aucune interface ne soit désactivée lorsque le seuil est dépassé.
Par défaut, le seuil désactive l’interface.
Exemple 2 : CRC
CRC incrémentation
fc13/1 is down (Initializing)
Port description is ***
Hardware is Fibre Channel, SFP is long wave laser cost reduced.
5 minutes input rate 32 bits/sec, 4 bytes/sec, 0 frames/sec
5 minutes output rate 32 bits/sec, 4 bytes/sec, 0 frames/sec
162 frames input, 6136 bytes
0 discards, 17 errors
17 CRC, 0 unknown class
0 too long, 17 too short
74 frames output, 6304 bytes
2 discards, 0 errors
108 input OLS, 54 LRR, 2 NOS, 0 loop inits
83 output OLS, 26 LRR, 56 NOS, 0 loop inits
Interface last changed at Tue May 27 08:37:20 2014
Motif général :
Le port enregistre une trame entrant dans le commutateur avec un CRC incorrect, mais une bonne fin de trame. Le compteur CRC incrémente uniquement sur le port d’entrée spécifique pour consigner l’erreur. Toutes les investigations doivent être effectuées sur cette liaison physique.
Actions attendues :
Voir l’action par défaut dans la résolution.
Effacez les statistiques des ports (comme indiqué ci-dessus au point 9) et vérifiez les compteurs et reprenez les données après 4 à 6 heures.
Exemple 3 : NOS
Séquence non opérationnelle (NOS)
show int fc1/1 counters
fc1/1
5 minutes input rate 1753296 bits/sec, 219162 bytes/sec, 199 frames/sec
5 minutes output rate 2310384 bits/sec, 288798 bytes/sec, 194 frames/sec
2741512190 frames input, 2542476084276 bytes
0 class-2 frames, 0 bytes
2741512190 class-3 frames, 2542476084276 bytes
0 class-f frames, 0 bytes
0 discards, 0 errors, 0 CRC
0 unknown class, 0 too long, 0 too short
3410405365 frames output, 5164364339412 bytes
0 class-2 frames, 0 bytes
3410405365 class-3 frames, 5164364339412 bytes
0 class-f frames, 0 bytes
0 discards, 0 errors
1 input OLS, 1 LRR, 0 NOS, 307 loop inits
289 output OLS, 289 LRR, 289 NOS, 289 loop inits
0 link failures, 0 sync losses, 0 signal losses
48276 BB credit transitions from zero
16 receive B2B credit remaining
3 transmit B2B credit remaining
3 low priority transmit B2B credit remaining
Motif général :
Perte de connexion avant les négociations de liaison.
Actions attendues :
vérifiez la couche 1 (couche physique) et le périphérique source.