FPIN-Meldungen (Fabric Performance Impact Notification) – Beschreibung und Bedeutung
Summary: FPIN-Meldungen (Fabric Performance Impact Notification) – Beschreibung und Bedeutung
Instructions
FPIN-Meldungen (Fabric Performance Impact Notification) wurden entwickelt, um Geräte innerhalb eines Fabric-Netzwerks proaktiv vor bestimmten Bedingungen zu warnen, die sich auf die Leistung auswirken können.
Fabric-Benachrichtigungen dienen als Frühwarnsystem, um negative Auswirkungen auf die Fabric-Performance abzumildern. Sie wurden entwickelt, um das I/O-Verhalten zu optimieren und beeinträchtigte Pfade zu vermeiden, indem Geräte über den aktuellen Fabric-Zustand benachrichtigt werden.
Dazu gehören Benachrichtigungen zu Link-Integrität, Zustellungsbenachrichtigungen und Überlastungsproblemen.
Fabric-Benachrichtigungen sind ein Mechanismus, der Endgeräten mehr Informationen zu Ereignissen in der Fabric zur Verfügung stellt und (dem Nutzer) helfen soll, die Datenflussprobleme zu beheben, die in modernen FC-SANs auftreten.
Die Benachrichtigungen teilen einem Endgerät im Wesentlichen mit, "You are sending too much into the fabric" or "Beware, there is a problem ahead—slow down or switch paths."
Das Endgerät wird auf ein Problem aufmerksam gemacht und kann Maßnahmen ergreifen, um eine Korrekturmaßnahme einzuleiten, indem es die sendenden oder empfangenden Geräte über die Überlastung informiert, bis sich ein Fabric-weites Ereignis entfaltet.
FC-Datenfluss und Auswirkungen:
- Der FC-Datenfluss kann durch folgende drei Problembereiche beeinträchtigt werden:
- Verbindungsintegrität: Fragwürdige/fehlerhafte Komponenten (SFPs, Kabel, Patchfelder) entlang eines SAN-Pfads können schwerwiegende Auswirkungen haben und führen häufig zu Anwendungsverschlechterungen, -abstürzen und -ausfällen.
-
- Nicht ordnungsgemäße MPIO-Einstellungen (Multi-Path Input Output): Die meisten standardmäßigen MPIO-Einstellungen verwenden das „Rundlaufverfahren“. Wenn es ein Problem bei der Verbindungsintegrität oder eine Überlastung gibt, verwendet MPIO, das auf das Rundlaufverfahren eingestellt ist, weiterhin einen beeinträchtigten (kranken, aber nicht toten) Pfad, der Daten an die Fabric sendet, was häufig zu Überlastung oder Schlimmerem führt.
- Überlastung: Tritt auf, wenn die Rate der in die Fabric eingehenden Frames die Rate der aus der Fabric ausgehenden Frames übersteigt. Dies zeigt sich oft als langsamer Abfluss.
-
-
- Überbelegung, die auftritt, wenn mehr Frames eintreffen, als verarbeitet werden können (Bandbreitenkonflikt).
- Dies ist heutzutage eher ein Problem, da schnellere 32-Gbit/s-Storage-Arrays mit Legacy-Fabrics mit 4 Gbit/s, 8 Gbit/s und 16 Gbit/s kombiniert werden.
- Credit-Stillstand, der auftritt, wenn ein Gerät keine Credits mehr zurückgibt und die Verbindung zum Stillstand kommt.
- Ein Gerät mit Credit-Stillstand zeigt ebenfalls einen „langsamen Abfluss“.
- Verlorene Credits durch physische Fehler, die Frames oder die Credit-Antwort beschädigen und die Kapazität der Verbindung verringern.
- Überbelegung, die auftritt, wenn mehr Frames eintreffen, als verarbeitet werden können (Bandbreitenkonflikt).
-
Elemente und Anforderungen:
Zwei Arten von Fabric-Benachrichtigungen
-
- Softwarebasierte Fabric-FPIN-ELS-Meldungen (Fabric Performance Impact Notifications, Extended Link Services)
- Hardwarebasierte CSPs (Congestion Signal Primitives)
Es müssen drei kritische Fabric-Services in die Fabric implementiert werden, damit Fabric-Benachrichtigungen gesendet/Core Extended Link Services (ELS) auf Fabric-Controllern (Switch) ausgeführt werden.
-
- Exchange Diagnostic Capabilities (EDC)
- Register Diagnostic Functions (RDF)
- Fabric Performance Impact Notifications (FPIN)
- So registrieren sich Geräte für Benachrichtigungen:
- Das Gerät muss die T11-Benachrichtigungsstandards unterstützen.
- Es gibt ein breites Spektrum an unterstützten Optionen von Anbietern von Storage-, Switch-, HBA-, Betriebssystem- und Multipathing-Software.
- Ein demnächst erscheinendes Whitepaper zu Fabric-Benachrichtigungen befasst sich mit unterstützten Geräten, Firmware und Betriebssystemen.
- Die Endgeräte, die Signale und FPINs empfangen sollen, registrieren sich nach der Anmeldung (FLOGI) beim Fabric Controller (in der Regel der Switch).
- Das Gerät muss die T11-Benachrichtigungsstandards unterstützen.
- Um erfolgreich Benachrichtigungen zu empfangen, muss für das Gerät Folgendes zutreffen:
- Es muss für den Empfang der jeweiligen Benachrichtigungsart registriert sein.
- Es muss die Bedingung für die Benachrichtigung vorliegen.
- Es muss sich um ein Peer-Gerät in der Zone handeln, in der die Bedingung auftritt.
Die Endgeräte, die Signale und FPINs empfangen sollen, registrieren sich nach der Anmeldung (FLOGI) mittels EDC (Exchange Diagnostic Capability) bzw. RDF (Register Diagnostic Function) beim Fabric Controller.
Um Benachrichtigungen zu erhalten, muss das Gerät für den Empfang der jeweiligen Benachrichtigung registriert sein, die Benachrichtigungsbedingung muss auftreten und es muss sich um ein Peer-Gerät in der Zone handeln, in der die Bedingung auftritt.
Es gibt 4 Arten von Ereignissen, für die FPINs erzeugt werden können (Software):
- Verbindungsintegrität: MPIO-Treiber erhalten Benachrichtigungen zur Verbindungsintegrität und managen die Pfadauswahl. Wenn MPIO mit einem beeinträchtigten Pfad verbunden ist, werden die betroffenen MPIO-Hosts benachrichtigt, damit sie Maßnahmen ergreifen können.
Die Informationen in der Benachrichtigung enthalten den Grund (Verbindungsfehler, Signalverlust, ungültiger CRC usw.) und den Schwellenwert, der überschritten wurde.
- Überlastung: Eine Überlastung, die an einem Fabric-F-Port erkannt wird, wird dem verbundenen Endgerät mitgeteilt.
FPIN-Überlastungsbenachrichtigungen sind wertvolle Informationen für Endgeräte, mit denen die I/O-Planung optimiert werden kann, z. B. durch die Verlangsamung der Übertragungsraten oder die Ausgabe serieller Lese-I/Os.
Im Allgemeinen geben Überlastungsbenachrichtigungen an, warum es zu langen Austauschzeiten gekommen ist.
- Peer-Überlastung: Peer-Überlastungsbenachrichtigungen werden an alle registrierten Peers von Endgeräten in der Zone gesendet, bei denen eine Überlastung auftritt.
Es gibt verschiedene Abhilfemaßnahmen, die Peers nutzen können, um diese Art von Überlastung zu reduzieren.
Wenn beispielsweise der Peer-Port die automatische Aushandlung schneller als der Zielport abgeschlossen hat, könnte der Peer seine Datenrate so einschränken, dass sie mit der des Ziels übereinstimmt.
- Zustellungsunterbrechung: Wenn eine Fabric ein Paket verworfen hat, informiert die Fabric-Benachrichtigung den Initiator über den Fehler, indem eine FPIN-Zustellbenachrichtigung gesendet wird.
Unabhängig davon, ob der Befehl von einer ISL- oder Endgeräteverbindung verworfen wurde, wird der Absender benachrichtigt.
Die Informationen in der Benachrichtigung enthalten den Ursachencode (Timeout, keine Route usw.) und einen Header für das verworfene Paket, aus dem sich die betroffenen Datenflüsse ableiten lassen.
Fabric-Benachrichtigungstypen – CSPs (Hardware)
- Hardwarebasierte CSPs (Congestion Signal Primitives)
- Werden in der Regel von der FC-1-Schicht des erkennenden Ports (in der Regel durch Low-Level-Firmware) an registrierte Geräte gesendet.
- Bestehen aus optischen Codes (nicht Frames), die über die Verbindung zwischen direkt verbundenen Fibre-Channel-Geräten gesendet werden. Sind nicht von Fabric-Latenzproblemen betroffen.
- Ermöglichen schnelle Erkennung (in Echtzeit) von plötzlichen Überlastungssituationen und sofortige Reaktion durch Signalisierung an den angeschlossenen physischen Port.
- Werden für PowerMax nicht unterstützt.
- Überlastungssignal:
Sie werden in der Regel von einer FC-1-Schicht des erkennenden Ports (normalerweise durch Low-Level-Firmware) an registrierte Geräte gesendet.
Zusätzlich zur FPIN werden Signale benötigt, da Primitives an einen überlasteten Port übertragen werden können, auch wenn keine Credits vorhanden sind (ein FPIN-Frame muss warten, wenn keine Credits verfügbar sind).
Im Gegensatz zu einer FPIN können Signale also als Echtzeitindikatoren für Überlastungen mit einer höheren Zustellungsgarantie betrachtet werden.
Fabric-Anforderungen:
- Brocade
- Connectrix DS-66xx-Switch-, MP-7810/7850B- und ED-DCX6B-Director-Hardware oder höher wird unterstützt.
- Brocade unterstützt Fabric-Benachrichtigungen für Fabric OS 9.0 oder höher.
- Die PowerMax-Integration wird mit Fabric OS 9.2.0a oder höher unterstützt.
- Fabric OS 9.2.0a bietet präzisere Schwellenwerte für Fabric-Benachrichtigungen.
- Für FPIN-LI ist eine Fabric Vision-Lizenz erforderlich.
- Die MAPS-Policy (konservativ, moderat oder aggressiv) muss aktiviert sein.
- Cisco MDS
- Cisco unterstützt Fabric-Benachrichtigungen für NX-OS 9.3.1 oder höher.
- Die PowerMax-Integration wurde mit 9.3(2a) getestet.
- Jeder Switch oder Director, der diese Versionen ausführen kann, wird unterstützt.
- Fabric-Benachrichtigungen sind standardmäßig nicht aktiviert und erfordern Schritte zur Aktivierung.
- Cisco unterstützt Fabric-Benachrichtigungen für NX-OS 9.3.1 oder höher.
- MPIO und PowerPath erfordern Betriebssysteme und HBAs, die Fabric-Benachrichtigungen unterstützen.
- Fabric-Benachrichtigungen müssen nicht von allen Komponenten unterstützt werden.
- Beispiel: alte 4G- und 8G-HBAs, bei denen alternde optische Komponenten und Überlastung ein erhebliches Problem darstellen.
Befolgen Sie für das Troubleshooting des Standard-FC-Ports immer den folgenden Selbsthilfeartikel:
Connectrix: Troubleshooting von Kommunikationsproblemen zwischen Fibre-Channel-Nodes und Switchport oder SFP durch Ausschlussverfahren, Selbsthilfe
Additional Information
SAN-Array- und Fabric-Administratoren können diese Probleme möglicherweise beheben, indem sie die optischen Anschlüsse der Kabel ordnungsgemäß reinigen. Weitere Informationen finden Sie unter Alle Produkte: Verunreinigungen wie Staub auf der Endfläche des Glasfaserkabelsteckers führen zu schlechter I/O-Performance