VPLEX: Diagnostizieren und Überwachen von Back-End-Problemen mit dem verbesserten Back-End-Pfadmanagement (BEPM) in GeoSynchrony 6.2
Summary: In diesem Artikel wird die Back-End-Pfadmanagementfunktion (BE) beschrieben, die GeoSynchrony 6.2 und höher hinzugefügt wurde. Außerdem wird die Handhabung von Back-End-Netzwerküberlastungen durch die geänderte BE-Pfadmanagementfunktion erläutert. ...
Symptoms
Vor GeoSynchrony 6.2 konnte VPLEX einige Pfade zu Back-End-Speicher-Volumes nicht isolieren, die aufgrund von Fabric-Überlastung oder Problemen mit dem Speicherarray eine hohe Latenz aufwiesen. In Version 6.2 isoliert VPLEX automatisch Pfade mit schlechter Performance zu Speicher-Volumes (Pfade mit hoher Latenz) und stellt sie automatisch wieder her, wenn die Performance auf ein akzeptables Niveau wiederhergestellt wird.
Neue Call Homes, die in GeoSynchrony 6.2 eingeführt wurden:
0x8a6b6001 – bepm/1 – Die Performance eines Back-end-IT-Nexus ist unter ein akzeptables Niveau gefallen.
0x8a6b6004 – bepm/4 – Auf einem Back-end-IT-Nexus wurden wiederholt Zeiträume mit schlechter Performance festgestellt.
0x8a6b6007 bepm/7 – Alle Initiator-Target-LUNs (ITLs) auf einer logischen Einheit auf diesem Director weisen eine schlechte Performance auf, sodass die logische Einheit als "degraded" gekennzeichnet wird.
Back-End-Pfade bestehen aus einem Initiator (VPLEX BE-Port) und einem Ziel (Port auf dem Array) und werden als IT Nexus bezeichnet.
Neue CLI-Befehle zum Überprüfen, welche BE-Pfade sich möglicherweise in einem heruntergestuften Zustand befinden:back-end degraded list und back-end degraded recover
Weitere Informationen zur Verwendung dieser Befehle finden Sie im VPLEX 6.2 CLI-Handbuch.
Das back-end degraded list Alle I-Ts angezeigt, die VPLEX aufgrund der hohen Latenz heruntergestuft hat.
Im Folgenden wird die Verwendung der help (-h) Option mit dem Befehl, um zu sehen, wie der Befehl verwendet werden kann:
VPlexcli:/>back-end degraded list -h
synopsis: list [<options]Zeigt eine Liste der heruntergestuften I-Ts>:
options an (* = erforderlich):
-h | --help
Zeigt die Verwendung dieses Befehls an.
--verbose
Bietet eine detailliertere Ausgabe während der Befehlsausführung. Dies hat bei einigen Befehlen möglicherweise keine Auswirkungen.
-g | --group-by= <gruppieren_nach>
Gruppiert heruntergestufte I-Ts nach dem angegebenen Feld. Unterstützte Felder: array, director
Beispiel für als heruntergestuft gekennzeichnete ITs – angezeigt mit Degradation Reason des Degraded performance:
VPlexcli:/> Liste
der heruntergestuften Back-ends HeruntergestufteI-Ts:
Director Director-Portinitiator Grund für
Verschlechterung des Zielarrays-------------- ------------- ------------------ ------------------ --------------------------- --------------------
director-1-1-A A1-FC00 0xc00144878f110800 0x50060160086429bb EMC-CLARiiON-APM00140624008 Herabgesetzte Leistung
A1-FC00 0xc00144878f110800 0xc00144878f3d0000 EMC-Invista-LABRATS4900007 Herabgesetzte Leistung
A1-FC00 0xc00144878f110800 0xc00144878f3d0200 EMC-Invista-LABRATS4900007 Herabgesetzte Leistung
A1-FC01 0xc00144878f110900 0xc00144878f3d0100 EMC-Invista-LABRATS4900007 Herabgesetzte Leistung
A1-FC01 0xc00144878f110900 0xc00144878f3d0300 EMC-Invista-LABRATS4900007 Herabgesetzte Leistung
director-1-1-B B1-FC00 0xc00144878f118800 0xc00144878f3d0000 EMC-Invista-LABRATS4900007 Herabgesetzte Leistung
B1-FC00 0xc00144878f118800 0xc00144878f3d0200 EMC-Invista-LABRATS4900007 Herabgesetzte Leistung
B1-FC01 0xc00144878f118900 0xc00144878f3d0100 EMC-Invista-LABRATS4900007 Herabgesetzte Leistung
B1-FC01 0xc00144878f118900 0xc00144878f3d0300 EMC-Invista-LABRATS4900007 Herabgesetzte Leistung
Wenn festgestellt wird, dass ein Back-end-IT-Pfad innerhalb eines Zeitraums von 30 Minuten dreimal zwischen heruntergestuft und nicht heruntergestuft (Flapping) wechselt, wird IT Nexus als instabil betrachtet, VPLEX beendet automatisch die Verwendung von IT Nexus für hostbasierte I/O und meldet das Call-Home-Ereignis 0x8a6b6004 oder bepm/4 in den Firmwareprotokollen. In diesem Zustand zeigt das Symbol back-end degraded list Befehlslisten Degradation Reason wie Isolated due to unstable performanceaus.
In diesem Fall bleibt IT Nexus heruntergestuft, bis der Endnutzer ihn entweder manuell mithilfe des CLI-Befehls wiederherstellt back-end degraded recoveroder der Standardschwellenwert von vier Stunden erreicht ist, nach dem der IT Nexus als Performance degraded Der Recovery-Prozess prüft die Integrität, bevor er die Herabstufung rückgängig macht (und den Pfad zum Bereitstellen hostbasierter I/O automatisch wieder aktiviert, wenn die Performancetests erfolgreich verlaufen).
Ein Beispiel für einen instabilen Zustand (zeitweilige Leistungsverschlechterung) Degradation Reason ist Isolated due to unstable performance:
VPlexcli:/>Back-end Degraded
I-Ts:
Director Director Initiator Grund für
Verschlechterung des Zielarrays-------------- Port ------------------ ------------------ ------------------------------- ------------------------------------- ------------ ------------------ ------------------ ------------------------------- -----------------------
director-1-1-A A1-FC00 0xc001448798b90800 0x5000097398037804 EMC-SYMMETRIX-197600222 Isoliert aufgrund instabiler Leistung
A1-FC00 0xc001448798b90800 0x5000097398037805 EMC-SYMMETRIX-197600222 Isoliert aufgrund instabiler Leistung
Wenn keine Pfade heruntergestuft sind, wird das back-end degraded list Der Befehl meldet dies:
VPlexcli:/>Back-end degraded list
Derzeit sind keine Pfade herabgesetzt.
Der andere neue CLI-Befehl, back-end degraded recover, ist für herabgestufte Back-end-Pfade. Im Folgenden wird die Verwendung der help (-h) mit der Option back-end degraded recover Befehl, um zu sehen, wie der Befehl verwendet werden kann:
VPlexcli:/>back-end degraded recover -h
synopsis: recover [<options>]
Stellt die angegebenen heruntergestuften I-Ts:
options wieder her (* = erforderlich):
-h | --help
Zeigt die Verwendung dieses Befehls an.
--verbose
Bietet eine detailliertere Ausgabe während der Befehlsausführung. Dies hat bei einigen Befehlen möglicherweise keine Auswirkungen.
-p | --paths= <Pfade>
Die heruntergestuften I-Ts, die wiederhergestellt werden sollen. Jeder I-T muss als Paar im Format "(<Initiator>,<Ziel>)" angegeben werden.
--alle
Stellen Sie alle derzeit heruntergestuften I-Ts wieder her.
Beispiel für eine einzelne I-T für die Wiederherstellung, angezeigt mit Degradation Reason des Isolated due to unstable performance:
VPlexcli:/>Back-end degraded recover -p (0xc00144878bda0900,0x5006016547e01af9)
Wiederhergestellte I-Ts:
Grund für
die Verschlechterung des Director-Director-Portinitiators des Zielarrays-------------- ------------- ------------------ ------------------ --------------------------- ------------------
director-1-1-A A1-FC01 0xc00144878bda0900 0x5006016547e01af9 EMC-CLARiiON-APM00164919257 Aufgrund instabiler Performance
isoliert Beispiel für alle heruntergestuften I-Ts, die wiederhergestellt werden sollen:
VPlexcli:/>Back-end degraded recover --all
Wiederhergestellte I-Ts:
Director Director Port Initiator Grund für Verschlechterung
des Zielarrays-------------- ------------- ------------------ ------------------ --------------------------- ------------------
director-1-1-A A1-FC00 0xc00144878bda0800 0x5000144260321e00 EMC-Invista-rc-surry-1 Aufgrund instabiler Performance
isoliertdirector-1-1-B B1-FC01 0xc00144878bda8900 0x5006016547e01af9 EMC-CLARiiON-APM00164919257 Isoliert wegen instabiler Leistung
Wenn das zeitweilige Latenzproblem für den betroffenen IT Nexus weiterhin besteht und der Nutzer die Ursache nicht schnell beheben kann, wird empfohlen, den VPLEX-Kundensupport per Live-Chat einzubeziehen, um IT Nexus manuell als herabgestuft zu markieren und den Pfad aus der Verwendung zu entfernen, bis das zugrunde liegende Problem behoben werden kann.
Cause
Probleme außerhalb des VPLEX, wie Fabric-Überlastung oder Array-Probleme, können zu Back-end-Problemen für das VPLEX führen. Obwohl GeoSynchrony 6.2 diese Art von Back-end-Überlastung besser bewältigen kann, sollte die Überlastung so schnell wie möglich behoben werden.
Um die Ursache der Überlastung zu ermitteln, verfügt Dell über eine FC-Port-Überwachungsfunktion, die die Fabric eines BE-FC-Ports auf Fehler überwacht. Die Ergebnisse können dazu beitragen, Netzwerkprobleme in der Fabric einzugrenzen. Ab GeoSynchrony 6.2 ist der FC-Portmonitor standardmäßig aktiviert.
Wenn Sie noch eine Version von GeoSynchrony 6.0.x oder 6.1.x ausführen und noch nicht bereit sind, ein Upgrade auf 6.2.x durchzuführen, aber das FC-Portmonitoring-Skript auf Ihrer VPLEX laden möchten, wenden Sie sich an den Dell Kundensupport, um das Skript zu laden.
Resolution
GeoSynchrony 6.2 kann diese Art von Netzwerküberlastung besser bewältigen. Wenn die BEPM-Funktion des VPLEX-Codes ausgelöst wird, weist dies auf Probleme außerhalb von VPLEX hin. Die Ursache für die Netzwerküberlastung oder Storage-Array-Probleme sollte sofort behoben werden. Die von den VPLEX-Protokollen bereitgestellten Daten können verwendet werden, um einzugrenzen, wo die Probleme auftreten. Sobald das Problem behoben ist, stellt VPLEX automatisch die I-Ts wieder her, die jetzt in Ordnung sind.