VPLEX: Diagnozowanie i monitorowanie problemów z zapleczem dzięki ulepszonemu zarządzaniu ścieżkami zaplecza (BEPM) w GeoSynchrony 6.2
Summary: W tym artykule omówiono funkcję zarządzania ścieżkami zaplecza (BE), która została dodana do GeoSynchrony 6.2 i nowszych. Omówiono w nim również obsługę przeciążeń sieci zaplecza dzięki zmienionej funkcji zarządzania ścieżkami BE. ...
Symptoms
W wersjach przed GeoSynchrony 6.2 VPLEX nie mógł wyizolować niektórych ścieżek do woluminów pamięci masowej zaplecza, w których występują duże opóźnienia z powodu przeciążenia sieci szkieletowej lub problemów z macierzą pamięci masowej. W wersji 6.2 VPLEX automatycznie izoluje ścieżki o niskiej wydajności do woluminów pamięci masowej (ścieżki o dużym opóźnieniu) i automatycznie je odzyskuje, gdy wydajność powróci do akceptowalnego poziomu.
Nowe Call Homes wprowadzone w GeoSynchrony 6.2:
0x8a6b6001 — bepm/1 — wydajność splotu IT zaplecza spadła poniżej akceptowalnych poziomów.
0x8a6b6004 — bepm/4 — wykryto powtarzające się okresy niskiej wydajności w splocie IT zaplecza.
0x8a6b6007 bepm/7 — wszystkie jednostki ITL (Initiator-Target-LUN) jednostki logicznej tego modułu director mają niską wydajność, więc jednostka logiczna jest oznaczona jako degraded.
Ścieżki zaplecza składają się z inicjatora (port VPLEX BE) i obiektu docelowego (portu w macierzy) i są określane jako Nexus IT.
Nowe polecenia CLI umożliwiające sprawdzenie, jakie ścieżki BE mogą być w stanie zdegradowanym:back-end degraded list i back-end degraded recover
Więcej informacji na temat korzystania z tych poleceń można znaleźć w podręczniku CLI VPLEX 6.2.
Ten back-end degraded list pokazuje wszystkie wejścia/wyjścia, dla których VPLEX uległ pogorszeniu z powodu dużego opóźnienia.
Poniżej przedstawiono zastosowanie metody help (-h) z poleceniem, aby zobaczyć, jak można użyć polecenia:
VPlexcli:/>back-end degraded list -h
synopsis: list [<options>]
Wyświetla listę zdegradowanych I-Ts:
options (* = wymagane):
-h | --help
Displays the usage for this command.
--verbose
Provides more output during command execution. This may not have any effect for some commands.
-g | --group-by= <group_by>
Group degraded I-Ts by the specified field. Obsługiwane pola: tablica, dyrektor
Przykład IT oznaczonych jako degraded — wyświetlane z symbolem Degradation Reason z Degraded performance:
VPlexcli:/> lista
zdegradowanych ustawień zapleczaObniżona wydajność I-TS:
Director Director Director Przyczyna
degradacji macierzy docelowej -------------- ------------- ------------------ ------------------ --------------------------- --------------------
director-1-1-A A1-FC00 0xc00144878f110800 0x50060160086429bb EMC-CLARiiON-APM00140624008 Obniżona wydajność
A1-FC00 0xc00144878f110800 0xc00144878f3d0000 EMC-Invista-LABRATS4900007 Obniżona wydajność
A1-FC00 0xc00144878f110800 0xc00144878f3d0200 EMC-Invista-LABRATS4900007 Obniżona wydajność
A1-FC01 0xc00144878f110900 0xc00144878f3d0100 EMC-Invista-LABRATS4900007 Obniżona wydajność
A1-FC01 0xc00144878f110900 0xc00144878f3d0300 EMC-Invista-LABRATS4900007 Obniżona wydajność
director-1-1-B B1-FC00 0xc00144878f118800 0xc00144878f3d0000 EMC-Invista-LABRATS4900007 Obniżona wydajność
B1-FC00 0xc00144878f118800 0xc00144878f3d0200 EMC-Invista-LABRATS4900007 Obniżona wydajność
B1-FC01 0xc00144878f118900 0xc00144878f3d0100 EMC-Invista-LABRATS4900007 Obniżona wydajność
B1-FC01 0xc00144878f118900 0xc00144878f3d0300 EMC-Invista-LABRATS4900007 Obniżona wydajność
Jeśli okaże się, że ścieżka IT zaplecza przełącza się między obniżoną wydajnością a undegraded (fluping) trzy razy w ciągu 30 minut, wówczas Nexus IT jest uznawany za niestabilny, a VPLEX automatycznie przestaje używać Nexusa IT dla we/wy opartego na hoście i zgłasza zdarzenie call home 0x8a6b6004 lub bepm/4 w dziennikach oprogramowania wewnętrznego. W tym stanie back-end degraded list Listy poleceń Degradation Reason gdy Isolated due to unstable performance.
W takim przypadku węzeł IT pozostanie w stanie zdegradowanym, dopóki użytkownik końcowy nie przywróci go ręcznie przy użyciu polecenia CLI back-end degraded recoverlub zostanie osiągnięty domyślny próg czterech godzin, po przekroczeniu którego węzeł IT zostanie oznaczony Performance degraded podczas gdy proces odzyskiwania sprawdza jego stan przed cofnięciem obniżenia jego wydajności (i automatycznie ponownie włącza ścieżkę do obsługi we/wy opartej na hoście, jeśli testy wydajności zakończą się pomyślnie).
Przykład stanu niestabilnego (sporadyczne pogorszenie wydajności) Degradation Reason jest Isolated due to unstable performance:
VPlexcli:/>lista zdegradowanych ustawień zapleczaObniżona wydajność
I-TS:
Director Director Inicjator Przyczyna
degradacji macierzy docelowej-------------- Port ------------------ ------------------ ------------------------------- ------------------------------------- ------------ ------------------ ------------------ ------------------------------- -----------------------
director-1-1-A A1-FC00 0xc001448798b90800 0x5000097398037804 EMC-SYMMETRIX-197600222 Izolowany z powodu niestabilnej wydajności
A1-FC00 0xc001448798b90800 0x5000097398037805 EMC-SYMMETRIX-197600222 Izolowany z powodu niestabilnego działania
Jeśli nie ulegnie pogorszeniu stanu żadnych ścieżek, back-end degraded list polecenie zgłasza to:
VPlexcli:/>back-end degraded list
Żadne ścieżki nie są obecnie degraded.
Inne nowe polecenie CLI, back-end degraded recover, jest dla zdegradowanych ścieżek zaplecza. Poniżej przedstawiono zastosowanie metody help (-h) opcja z opcją back-end degraded recover polecenie, aby zobaczyć, jak można użyć polecenia:
VPlexcli:/>back-end degraded recover -h
synopsis: recover [<opcje>]
Odzyskuje określone zdegradowane I-TS:
options (* = wymagane):
-h | --help
Displays the usage for this command.
--verbose
Provides more output during command execution. This may not have any effect for some commands.
-p | --paths= <paths>
The degraded I-Ts to recover. Each I-T must be expressed as a pair in the form "(<initiator>,<target>)".
--cały
Odzyskaj wszystkie bieżące obniżone I-T.
Przykład pojedynczego I-T dla odzyskiwania, wyświetlany z Degradation Reason z Isolated due to unstable performance:
VPlexcli:/>back-end degraded recover -p (0xc00144878bda0900,0x5006016547e01af9)
Recovered I-T:
Director Director Initiator Port Initiator Przyczyna
degradacji macierzy docelowej-------------- ------------- ------------------ ------------------ --------------------------- ------------------
director-1-1-A A1-FC01 0xc00144878bda0900 0x5006016547e01af9 EMC-CLARiiON-APM00164919257 Izolowany z powodu niestabilnej wydajności
Przykład wszystkich zdegradowanych I-T do odzyskania:
VPlexcli:/>back-end degraded recover --all
Recovered I-Ts:
Director Director Inicjator portu Przyczyna
degradacji macierzy docelowej-------------- ------------- ------------------ ------------------ --------------------------- ------------------
director-1-1-A A1-FC00 0xc00144878bda0800 0x5000144260321e00 EMC-Invista-rc-surry-1 Izolowany z powodu niestabilnej wydajności
director-1-1-B B1-FC01 0xc00144878bda8900 0x5006016547e01af9 EMC-CLARiiON-APM00164919257 Izolowany ze względu na niestabilną wydajność
Jeśli sporadyczny problem z opóźnieniami nie ustąpi w przypadku splotu IT, którego dotyczy problem, a użytkownik nie może szybko usunąć głównej przyczyny, zaleca się skontaktowanie się z działem obsługi klienta VPLEX za pośrednictwem czatu na żywo w celu ręcznego oznaczenia obniżonego poziomu IT w celu usunięcia ścieżki z użytku do czasu rozwiązania podstawowego problemu.
Cause
Problemy zewnętrzne względem VPLEX, takie jak przeciążenie sieci szkieletowej lub problemy z macierzą, mogą prowadzić do problemów z zapleczem VPLEX. Chociaż oprogramowanie GeoSynchrony 6.2 zostało zaprojektowane tak, aby lepiej radzić sobie z tego rodzaju przeciążeniami BE, zaleca się jak najszybsze rozwiązanie przeciążenia.
W celu wykrycia źródła zatorów firma Dell oferuje funkcję monitorowania portów FC, która monitoruje błędy w sieci szkieletowej dowolnego portu BE FC. Wyniki mogą pomóc w zawężeniu problemów z siecią w sieci szkieletowej. Począwszy od GeoSynchrony 6.2, monitor portów FC jest domyślnie włączony.
Jeśli nadal korzystasz z dowolnej wersji GeoSynchrony 6.0.x lub 6.1.x i nie jesteś jeszcze gotowy do aktualizacji do wersji 6.2.x, ale chcesz załadować skrypt monitorowania portów FC na VPLEX, skontaktuj się z działem obsługi klienta firmy Dell w celu załadowania skryptu.
Resolution
Oprogramowanie GeoSynchrony 6.2 zostało zaprojektowane tak, aby lepiej radzić sobie z tego rodzaju przeciążeniem sieci. Po wyzwoleniu funkcji BEPM kodu VPLEX sygnalizuje ona problemy zewnętrzne w stosunku do VPLEX. Przyczyna przeciążenia sieci lub problemy z macierzą pamięci masowej powinna zostać natychmiast naprawiona. Dane dostarczane przez dzienniki VPLEX mogą pomóc w zawężeniu lokalizacji problemów. Po naprawieniu problemu VPLEX automatycznie przywraca I-T, które będą teraz sprawne.