Les messages de notification de l’impact sur les performances de la fabric (FPIN), que sont-ils et que signifient-ils ?
Sommaire: Les messages de notification de l’impact sur les performances de la fabric (FPIN), que sont-ils et que signifient-ils ?
Instructions
Les messages FPIN (Performance Performance Impact Notification) sont conçus pour alerter proactivement les appareils d’un réseau de fabric de conditions spécifiques susceptibles d’affecter les performances.
Les messages de notification de fabric servent de système d’alerte précoce pour atténuer tout effet négatif sur les performances du fabric et ont été développés pour optimiser le comportement des E/S et éviter les chemins altérés en informant les appareils des conditions actuelles du fabric.
Ils comprennent des notifications concernant l’intégrité des liens, les notifications de livraison et les problèmes de congestion.
Les notifications de fabric sont un mécanisme qui fournit aux périphériques finaux plus d’informations sur les événements de la fabric et sont destinées à aider (l’utilisateur) à résoudre les problèmes de flux de données rencontrés dans les SAN FC modernes.
Les notifications indiquent essentiellement à un appareil distant, "You are sending too much into the fabric" or "Beware, there is a problem ahead—slow down or switch paths."
L’appareil distant est averti d’un problème et peut déclencher des mesures correctives proactivement en informant les appareils émetteurs ou récepteurs de l’encombrement jusqu’à ce qu’un événement se produise à l’échelle de la structure.
Flux de données FC et impact :
- Le flux de données FC peut être affecté par trois problèmes dans
- Intégrité de la liaison : des composants douteux/défectueux (SFP, câbles, tableaux de connexions) le long d’un chemin SAN peuvent avoir de graves impacts et conduisent souvent à une dégradation des applications, à des plantages et à des pannes.
-
- Paramètres MPIO (Multi-Path Input Output) incorrects : La plupart des paramètres MPIO par défaut utilisent la permutation circulaire. En cas de problème d’intégrité de la liaison ou de congestion, les paramètres MPIO définis sur la permutation circulaire continuent d’utiliser un chemin altéré (endommagé mais pas inactif) envoyant des données dans la fabric, ce qui entraîne souvent une congestion ou pire encore.
- Congestion : Se produit lorsque le taux de trames entrant dans la structure dépasse le taux de trames sortant de la structure. Cela est souvent considéré comme une décharge lente.
-
-
- Surabonnement, qui se produit lorsque le nombre de trames qui arrivent est supérieur au nombre de trames qui peuvent être traitées (non-correspondance de bande passante).
- Plus problématique aujourd’hui, car des baies de stockage de 32 Gbit/s plus rapides sont combinées à d’anciennes fabrics de 4 Gbit/s, 8 Gbit/s et 16 Gbit/s.
- Blocage de crédit, qui se produit lorsqu’un appareil cesse de renvoyer des crédits, ce qui immobilise la liaison.
- Un appareil dont le crédit est bloqué est considéré comme une « décharge lente ».
- Pertes de crédits, qui se produisent lorsque des erreurs physiques endommagent les trames ou la réponse des crédits et réduisent la capacité de la liaison.
- Surabonnement, qui se produit lorsque le nombre de trames qui arrivent est supérieur au nombre de trames qui peuvent être traitées (non-correspondance de bande passante).
-
Éléments et exigences :
Deux types de notifications de fabric
-
- Notifications de l’impact sur les performances de la fabric basées sur logiciel (FPIN), messages ELS (Extended Link Services)
- Primitives de signaux de congestion (CSP) basées sur des composants matériels
Trois services de fabric essentiels sont nécessaires pour permettre aux notifications d’avoir lieu/Services Core Extended Link Services (ELS) opérant sur les contrôleurs de fabric (commutateur).
-
- Fonctionnalité d’échange de diagnostic (EDC)
- Fonction d’enregistrement du diagnostic (RDF)
- Notifications de l’impact sur les performances de la fabric basées sur logiciel (FPIN)
- Mode d’inscription appareils aux notifications :
- L’appareil doit prendre en charge les normes de notification T11.
- Une prise en charge étendue est disponible auprès des fournisseurs de logiciels de stockage, de commutateur, d’adaptateur HBA, de système d’exploitation et de multipathing
- Un futur livre blanc sur les notifications de fabric explique en détail les appareils, les firmwares et les systèmes d’exploitation pris en charge
- Les appareils finaux intéressés par la réception de signaux et de FPIN s’inscrivent auprès du contrôleur de la fabric (généralement le commutateur) après la connexion (FLOGI)
- L’appareil doit prendre en charge les normes de notification T11.
- Pour recevoir les notifications, un appareil doit :
- Être inscrit pour recevoir un type de notification particulier.
- Respecter la condition de notification.
- Être un appareil homologue dans la zone où la condition existe.
Les appareils finaux intéressés par la réception de signaux et de FPIN s’inscrivent à l’aide de la fonctionnalité d’échange de diagnostic (EDC) et de la fonction d’enregistrement du diagnostic (RDF) respectivement auprès du contrôleur de la fabric après la connexion (FLOGI).
Pour recevoir des notifications, l’appareil doit être inscrit pour recevoir la notification particulière, respecter la condition de notification et être un appareil homologue dans la zone où la condition existe.
Il existe 4 types d’événements pour lesquels des FPIN peuvent être générées (logiciels) :
- Intégrité de la liaison : Les pilotes MPIO reçoivent des notifications Intégrité de la liaison et gèrent la sélection des chemins. Lorsque MPIO est connecté à un chemin perturbé, les hôtes MPIO concernés sont avertis afin qu’ils puissent agir.
Les informations incluent la raison (échec de la liaison, perte du signal, CRC non valide, etc.) et une valeur de seuil qui a été dépassée.
- Congestion : Une condition de congestion détectée sur un port F de fabric sera notifiée à l’appareil connecté.
Les notifications de congestion FPIN sont des informations précieuses pour les appareils finaux qui peuvent optimiser la planification des E/S, par exemple, ralentir les taux de transfert ou émettre des E/S de lecture série.
En général, les notifications de congestion indiquent pourquoi les durées d’exécution des échanges peuvent être importantes.
- Congestion d’homologue : les notifications de congestion d’homologue sont envoyées à tous les homologues des appareils finaux inscrits dans la zone qui subissent une congestion.
Les homologues ont le choix entre plusieurs solutions pour corriger ce type de congestion.
Par exemple, si le port de l’homologue a effectué une négociation automatique plus rapide que le port de destination, l’homologue peut limiter son débit de données pour qu’il corresponde à celui de la destination.
- Interruption de la remise : lorsqu’une fabric a rejeté un paquet, les notifications de fabric informent l’initiateur de l’échec en envoyant une notification de remise FPIN.
Que la commande soit abandonnée par une connexion d’appareil final ou ISL, l’initiateur en est averti.
Les informations incluent le code de motif (délai d’expiration, absence de route, etc.) et un en-tête de paquet abandonné utilisé pour déduire les flux affectés par l’abandon.
Types de notification de fabric : CSP (matériel)
- Primitives de signaux de congestion (CSP) basées sur des composants matériels
- Généralement envoyées depuis la couche FC-1 du port de détection (généralement par firmware de bas niveau) à des appareils inscrits
- Constituées de codes optiques (et non de trames) envoyés sur la liaison entre les appareils Fibre Channel connectés directement. Non sujettes à des problèmes de latence de fabric
- Détectent rapidement (en temps réel) les situations de congestion soudaine et réagissent immédiatement en signalant le port physique connecté.
- Non prises en charge avec PowerMax
- Signal de congestion :
Cette information est généralement envoyée depuis une couche FC-1 du port de détection (généralement par le biais d’un firmware de bas niveau) à des appareils inscrits.
Des signaux sont requis en plus de la FPIN, car les primitives peuvent être transmises sur un port congestionné même lorsqu’il n’y a pas de crédits disponibles (une trame FPIN doit attendre lorsqu’il n’y a pas de crédits).
En conséquence, contrairement aux notifications FPIN, les signaux peuvent être considérés comme des indicateurs de congestion en temps réel avec une meilleure garantie de remise.
Exigences de fabric :
- Brocade
- Commutateur Connectrix DS-66xx, prise en charge des matériels directeurs MP-7810/7850B et ED-DCX6B ou version ultérieure.
- Brocade prend en charge les notifications de fabric avec Fabric OS 9.0 ou version ultérieure
- L’intégration de PowerMax est prise en charge avec Fabric OS 9.2.0a ou version supérieure
- Fabric OS 9.2.0a dispose de seuils plus précis pour les notifications de fabric
- Licence Fabric Vision requise pour FPIN-LI
- La stratégie MAPS (conservatrice, modérée ou agressive) doit être activée
- Cisco MDS
- Cisco prend en charge les notifications de fabric avec NX-OS 9.3.1 ou version ultérieure
- L’intégration de PowerMax a été testée avec la version 9.3(2a)
- Tout commutateur ou directeur capable d’exécuter ces versions est pris en charge.
- Les notifications de fabric ne sont pas activées par défaut et nécessitent plusieurs étapes pour être activées.
- Cisco prend en charge les notifications de fabric avec NX-OS 9.3.1 ou version ultérieure
- MPIO et PowerPath nécessitent des systèmes d’exploitation et des adaptateurs HBA qui prennent en charge les notifications de fabric.
- Tous les composants n’ont pas besoin de prendre en charge les notifications de fabric
- Par exemple, les anciens adaptateurs HBA 4G et 8G ont présenté des problèmes majeurs tels que l’usure des composants optiques et la congestion.
Pour le dépannage du port FC par défaut, suivez toujours l’article d’autoassistance :
Connectrix : Dépannage des problèmes de communication du nœud Fibre Channel au port du commutateur ou du SFP par élimination, auto-assistance (en anglais).
Renseignements supplémentaires
Les administrateurs de matrices SAN et de fabric peuvent être en mesure de résoudre ces problèmes en nettoyant correctement les connecteurs optiques des câbles. Pour plus d’informations, voir Tous les produits : Les contaminants tels que la poussière sur l’extrémité du connecteur à fibre optique réduisent les performances d’E/S