PowerVault ME5 : Le lien hôte PHY présente un nombre d’erreurs supérieur au seuil d’erreur.
Summary: Les opérateurs de systèmes PowerVault ME5 peuvent observer occasionnellement des messages « event 663 host link PHY error count » dans le journal d’historique des événements lorsqu’ils utilisent des ports front-end de contrôleur Fibre Channel ou SAS connectés à des hôtes ou à des commutateurs. Cet événement a été introduit dans la version ME5.1.2.1.0 et versions ultérieures du firmware ME5. ...
Instructions
En fonction de la configuration du module de contrôleur PowerVault série ME5, accédez à la section appropriée de cet article.
- Modules de contrôleur utilisant des ports frontaux Fibre Channel (FC)
- Modules de contrôleur utilisant des ports frontaux SAS (Serial Attached SCSI)
Ports frontaux Fibre Channel (FC)
Les opérateurs de baies PowerVault série ME5 utilisant des modules de contrôleur connectés à l’aide d’émetteurs-récepteurs SFP Fibre Channel (FC) peuvent avoir besoin de prendre des mesures correctives pour résoudre ce symptôme. Le problème n’affecte généralement pas le traitement des E/S, mais le message indique en amont un problème de configuration, un problème matériel potentiel ou un problème de connexion au niveau de l’émetteur-récepteur SFP ou du câble à fibre optique.
Dans la plupart des cas, ce problème est facilement résolu en nettoyant correctement l’extrémité du connecteur LC sur le câble à fibre optique afin d’éliminer la poussière ou d’autres contaminants qui nuisent à la réfraction de la lumière. Pour obtenir des instructions sur l’inspection et le nettoyage de l’extrémité du connecteur de câbles à fibre optique, suivez les conseils de cet article de la base de connaissances : Les contaminants tels que la poussière sur l’extrémité du connecteur à fibre optique réduisent les performances d’E/S
A41844 2024-08-12 10:45:54 112 INFORMATIONAL Host link down. (port: 1) A41853 2024-08-12 10:46:30 111 INFORMATIONAL Host link up. (port: 1, speed: 32 Gbps, point-to-point, fabric) A42131 2024-10-13 18:44:37 663 ERROR The host link PHY error count is greater than the error threshold. (port: 1, type: ) A42132 2024-10-13 18:46:44 663 RESOLVED The host link PHY error count has been resolved. (port: 1, type: resolved)
Les versions ME5.1.2.1.0 et supérieures du firmware de la baie PowerVault ME5 surveillent le nombre de mots de transmission non valides des ports FC. Cette valeur de compteur signifie qu’un mot n’a pas été transmis correctement, ce qui a entraîné des erreurs de codage. Cette valeur de compteur ne s’affiche pas dans PowerVault Manager ou la CLI, mais elle est enregistrée dans le journal de débogage de chaque contrôleur de stockage (SC). Les journaux de débogage SC du contrôleur sont collectés à l’intérieur du bundle de support PowerVault ME. Reportez-vous à PowerVault ME5 : Collecter les journaux de support de PowerVault
Si ce message d’erreur est fréquemment observé, les opérateurs peuvent effectuer les actions suivantes :
-
Vérifiez l’installation du câble à fibre optique et nettoyez correctement l’extrémité du connecteur de câble à fibre optique, puis surveillez les journaux d’historique des événements pour détecter les occurrences répétées de l’événement 663. Voir l’article Les contaminants tels que la poussière sur l’extrémité du connecteur à fibre optique réduisent les performances d’E/S
-
Si le problème persiste après un nettoyage des connecteurs de câble à fibre optique, remplacez-le par un émetteur-récepteur et un câble à fibre optique dont le fonctionnement a été vérifié. Assurez-vous que les pièces ne sont pas endommagées et qu’elles sont manipulées correctement.
-
Si le remplacement des émetteurs-récepteurs ne résout pas le symptôme, les opérateurs doivent utiliser des émetteurs-récepteurs validés, comme indiqué dans la Matrice de support des systèmes de stockage Dell PowerVault série ME5, ou contacter leur fournisseur pour obtenir de l’aide.
-
Bien que cela soit rare, les opérateurs qui utilisent des commutateurs FC 8 Gbit/s d’ancienne génération peuvent avoir besoin d’ajuster le paramètre portCfgFillword de leur commutateur. Voir la section « Informations supplémentaires » ci-dessous.
Contrôleurs utilisant des ports frontaux SAS (Serial Attached SCSI)
Chaque connexion de câble SAS entre l’hôte et le contrôleur forme un port SAS qui se compose de plusieurs liaisons physiques (PHY). Chaque PHY est un ensemble de quatre fils utilisés comme deux paires de signaux différentiels, ce qui permet de transmettre les données simultanément dans les deux directions.
En général, cela n’a pas d’impact sur le traitement des entrées et sorties (E/S), car cet événement est prévu lorsqu’on branche les câbles SAS pour former une liaison SAS. Dans les configurations de contrôleurs redondantes, l’événement 663 est enregistré simultanément sur les deux contrôleurs lorsque le serveur hôte connecté démarre et charge le pilote SAS du système d’exploitation hôte. Aucune autre action n’est requise de la part de l’opérateur.
Autres considérations :
Lorsque les contrôleurs PowerVault ME sont connectés à un adaptateur Dell SAS HBA355e. Les connexions des ports du serveur hôte peuvent être distribuées (voir l’article PowerVault série ME5 signale que le port hôte est dégradé lorsqu’il est connecté au contrôleur SAS Dell HBA355e) après un changement des adaptateurs HBA SAS du serveur ou une modification des ports HBA SAS utilisés. Utilisez PowerVault Manager pour vérifier que l’ID WWN de l’initiateur de port est mappé aux hôtes et volumes appropriés.
Assurez-vous que les câbles SAS sont correctement insérés en tirant doucement à chaque extrémité du câble SAS. Si le câble SAS sort du port, réinstallez-le correctement. Vous pouvez entendre un clic lorsque le loquet du connecteur est fixé. Si le connecteur du câble SAS ne peut pas être correctement fixé, vérifiez quel logement PCI-e est utilisé dans le serveur hôte. La position du logement de la carte HBA SAS dans le châssis peut gêner l’insertion du connecteur. Pour plus d’informations, voir Modèles PowerEdge 16G : sélection du logement PCI-e HBA355e
Exemple de journal d’historique des événements PowerVault ME5 lorsqu’un hôte connecté SAS est redémarré. Les deux contrôleurs enregistrent l’événement, et le dernier événement de la séquence indique que le problème est résolu.
B1473 2024-08-15 09:55:22 112 INFORMATIONAL Host link down. (port: 2) A3538 2024-08-15 09:55:26 112 INFORMATIONAL Host link down. (port: 2) B1483 2024-08-15 09:55:29 111 INFORMATIONAL Host link up. (port: 2, type: SAS) A3547 2024-08-15 09:55:32 111 INFORMATIONAL Host link up. (port: 2, type: SAS) A3911 2024-10-22 10:10:46 354 WARNING Host SAS topology was changed. (host port: 2, 0 out of 4 PHYs are up, link speed: Autonegotiated) B1640 2024-10-22 10:10:46 354 WARNING Host SAS topology was changed. (host port: 2, 0 out of 4 PHYs are up, link speed: Autonegotiated) A3912 2024-10-22 10:11:55 354 INFORMATIONAL Host SAS topology was changed. (host port: 2, 4 out of 4 PHYs are up, link speed: 12 Gbps) B1641 2024-10-22 10:11:55 354 INFORMATIONAL Host SAS topology was changed. (host port: 2, 4 out of 4 PHYs are up, link speed: 12 Gbps) A3913 2024-10-22 10:12:58 663 ERROR The host link PHY error count is greater than the error threshold. (port: 2, type: disparity errors, lost dword count, invalid dword count) B1642 2024-10-22 10:13:33 663 ERROR The host link PHY error count is greater than the error threshold. (port: 2, type: disparity errors, lost dword count, invalid dword count) A3914 2024-10-22 10:15:00 663 RESOLVED The host link PHY error count has been resolved. (port: 2, type: resolved)
Additional Information
Les opérateurs utilisant des commutateurs FC Connectrix ou Brocade d’ancienne génération qui prennent en charge 8 Gbit/s peuvent configurer le paramètre fillword à l’aide de la commande portCfgFillword . Lors de l’introduction des commutateurs 8 Gbit/s, ARBff a été adopté en remplacement d’IDLE, principalement parce qu’il pouvait contribuer à réduire le taux d’erreur binaire. IDLE, qui était utilisé pour l’initialisation, a également été remplacé par ARBff, en même temps que le changement de paramètre fillword.
Les opérateurs de commutateurs FC d’ancienne génération qui continuent à les utiliser en production peuvent observer une augmentation du nombre de mots de transmission non valides et avoir besoin de définir la valeur portcfgfillword pour pouvoir toujours utiliser ARBff. Sur un commutateur Brocade, il s’agit de la sortie de «portcfgfillword --help. »
admin> portcfgfillword --help
Usage: portCfgFillWord [SlotNumber/]PortNumber Mode [Passive]
Mode: 0/-idle-idle - IDLE in Link Init, IDLE as fill word (default)
1/-arbff-arbff - ARBFF in Link Init, ARBFF as fill word
2/-idle-arbff - IDLE inLink Init, ARBFF as fill word (SW)
3/-aa-then-ia - If ARBFF/ARBFF failed, then do IDLE/ARBFF
Passive: 0/1
admin>
0: Use IDLE for initialization as 4Gb switches do.
1: Always use ARBff.
2: Use IDLE for initialization and use ARBff for between data frames.
3: Use ARBff for initialization first. If it fails, use IDLE. Use ARBff for between data frames.