Article Number: 000188498

VPLEX: Woluminy pamięci zgłaszają „Operational Status” i „Health State” jako „unknown”

Summary: Niedopasowanie wersji między serwerem zarządzania a katalogami powoduje, że wszystkie woluminy pamięci zgłaszają „Operational Status” i „Health State” jako „unknown”.

This article may have been automatically translated. If you have any feedback regarding its quality, please let us know using the form at the bottom of this page.

Article Content

Symptoms

W przypadku niedopasowania wersji, gdy aktualizacja oprogramowania wewnętrznego VPLEX nie powiedzie się i zostanie cofnięta, możemy trafić na sytuację, w której VPLEX VS6 MMCS-A (serwer zarządzania) operuje na wyższej wersji oprogramowania wewnętrznego (6.2.x), a katalogi operują na oryginalnej, niższej wersji oprogramowania wewnętrznego (tj. 6.1.x). Powoduje to problem natury kosmetycznej w interfejsie użytkownika VPLEX, w wyniku którego wszystkie woluminy pamięci w systemie zgłaszają stan „operational” i „health” jako „unknown”. Jednak przy bliższym spojrzeniu woluminy są aktywne, a wolumin wirtualny najwyższego poziomu nie ulega pogorszeniu.

1] Potwierdź, że nastąpiło niedopasowanie kodów. Można to zrobić za pomocą polecenia VPlexcli „health-check” i/lub polecenia VPlexcli „version-a”.

Poniższy przykład pochodzi z górnej sekcji danych wyjściowych kontroli poprawności działania:

Product Version: Version mismatch (or NDU) << mismatch indicates there is a different                                                                                                     firmware version between the                                                                                                     management server and directors Product Type: Metro WAN Connectivity Type: FC Hardware Type: VPL <-- represents the VS6 Cluster Size: 4 engines <-- says this is Quad Engine configuration, 2 = Dual and 1 = Single Cluster TLA:      cluster-1: CKMXXXXXXXXXXX      cluster-2: CKMXXXXXXXXXXX The storage-volume issue is most apparent in the VPlexcli command “storage-volume summary” output and is also visible from the Back-End (BE) Storage portion of the 'health-check' command output. The issue is not reported in the 'ndu pre-check', the 'connectivity validate-be', nor the 'cluster-status' command outputs. Example from VPlexcli outputs provided below. Before the failed NDU attempt no storage volumes will report as 'unknown', yet after the failed NDU we will see the following, the storage-volume 'IO status' will equal 'alive', however, the 'Operational Status' and the 'Health State'  will equal 'unknown' for all storage volumes. VPlexcli:/> storage-volume summary SUMMARY (cluster-1) StorageVolume Name                       IO Status  Operational Status  Health State ---------------------------------------  ---------  ------------------  ------------ VCKM001530XXX1-00003                     alive      unknown             unknown  << observe VCKM001530XXX2-00004                     alive      unknown             unknown  << VCKM001530XXX3-00006                     alive      unknown             unknown  << . . Storage-Volume Summary  (no tier) ----------------------  --------------------- Health                  out-of-date         0                         storage-volumes  4372  << note the total number of storage volumes in the system                                            unhealthy        4372  << note the total number of volumes equal unhealthy, all                                                                                          storage volumes in the system are now reporting                                                                                          unhealthy. Vendor                  DGC              1276                         XtremIO          3096 Use                     claimed             1                         meta-data           4                         unclaimed           5                         used             4362 Capacity                total           2.92P From the VPLEX 'health-check' command output scroll to the section called “BE Storage” and check the “Unhealthy Storage Volumes” to see all volumes are reported Unhealthy. BE Storage: << ----------- Cluster    Total     Unhealthy  Total Storage  No     Not visible  With         Total     Name       Storage   Storage    Provisioned/   Dual   from         Unsupported  Extents/             Volumes/  Volumes    Limit          Paths  All Dirs     # of Paths   Limit                Limit                                                                           ---------  --------  ---------  -------------  -----  -----------  -----------  --------  cluster-1  4372/12000 4372      2.92P/8PB      0      0            0            4362/24000 cluster-2  4372/12000 4372      2.92P/8PB      0      0            0            4362/24000

Patrząc na „FE Storage” znajdującą się bezpośrednio pod sekcją „BE storage” w danych wyjściowych polecenia „health-check” omówionych powyżej, zobaczysz 0 (lub mniej) niezdrowych woluminów wirtualnych. Jest to kluczowe do potwierdzenia, że jest to problem natury kosmetycznej z interfejsem użytkownika VPLEX.

[Uwaga]: W przypadku rzeczywistego problemu z woluminami pamięci powinno dojść do pogorszenia woluminu wirtualnego najwyższego poziomu. W poleceniu VPlexcli „virtual-volume summary” nie powinno być żadnych woluminów wirtualnych, które uległy pogorszeniu (lub powinno być ich mniej). Jeśli jednak zgłaszane są niezdrowe woluminy wirtualne lub takie, które uległy pogorszeniu, należy przerwać pracę, ponieważ może występować oddzielny problem wymagający dokładniejszej analizy poza zakresem tej bazy wiedzy.

FE Storage: ----------- Cluster    Total       Unhealthy  Total Dist  Unhealthy  Local          With unsupported  Name       Virtual     Virtual    Devs/       Dist       Top-Level      RAID1 mirror        Volumes/    Volumes    Limit       Devs       Devices/Limit  legs                Limit                                                                          ---------  ----------  ---------  ----------  ---------  -------------  ----------------  cluster-1  3794/12000  0          1024/12000  0          2770/12000     0                 cluster-2  4356/12000  0          1024/12000  0          3333/12000     0

Cause

Podczas uaktualniania oprogramowania wewnętrznego VPLEX procedura wysokiego poziomu jest następująca:

Uaktualnij serwer zarządzania VS6 (MMCS-A) do nowej, wyższej wersji docelowej
Uaktualnij katalogi VPLEX do nowej wersji docelowej

Odbywa się to w dwóch oddzielnych krokach, tworząc sytuację, w której serwer zarządzania pracuje na nowym kodzie (w tym przypadku 6.2.x), a katalogi nadal są na oryginalnej, niższej wersji kodera (tj. 6.1.x), w którym to przypadku może wystąpić powyższy problem.

W sytuacjach, w których mamy problem lub blokadę w ukończeniu aktualizacji kodu w katalogach, możemy mieć do czynienia z sytuacją, w której niedopasowanie kodu MMCS i katalogów może być obecne przez dłuższy czas, podczas gdy my badamy problem lub blokadę aktualizacji. W tym czasie wszystkie woluminy pamięci będą zgłaszać „unknown”.

Ten problem jest spowodowany niedopasowaniem wersji pomiędzy serwerem zarządzania a katalogami. Polecenie podstawowe oprogramowania wewnętrznego nie działa, co prowadzi do stanu „unknown” dla „Health State”.
Można to zauważyć poprzez wielokrotne przesyłanie strumieniowe poniższego zdarzenia w dziennikach klienta:

[https-jsse-nio-49881-exec-9] CommandResult: Polecenie 'mdi get disk --tabular diskId ioStatus where visibility == "external" and ioStatus != "ok"' zwróciło kod błędu 1000000015 (nieprawidłowe polecenie podrzędne).

Polecenie kończy się niepowodzeniem, ponieważ wydaje polecenie podrzędne obecne w wersji 6.2, które nie jest obecne w wersji 6.1.x, a zatem jest zwracane jako nieprawidłowe przez oprogramowanie wewnętrzne katalogu, powodując stan „unknown” opisany powyżej.

Resolution

Ogólnie rzecz biorąc, można pracować przez pewien czas z niedopasowanym oprogramowaniem wewnętrznym, jednak nie zaleca się pozostawania w takim stanie przez zbyt długi czas i zaleca się rozwiązanie tego problemu tak szybko, jak to możliwe.

Rozwiązanie:
ten problem zostaje rozwiązany po zakończeniu aktualizacji u oprogramowania wewnętrznego katalogów, dzięki czemu katalogi i serwer zarządzania uzyskują tę samą pasującą wersję kodu. Jest to preferowana opcja rozwiązania tego problemu i właśnie ona powinna być zastosowana.

Jak wspomniano wcześniej w tym artykule, jest to problem natury kosmetycznej i można kontynuować aktualizację oprogramowania wewnętrznego katalogu, gdy ten problem jest obecny.

Ten problem, choć drobny, może powodować inne powiązane problemy, takie jak:

Opóźnienia aktualizacji VPLEX, jeśli problem zostanie zauważony przez inżyniera aktualizacji (RCM) między serwerem zarządzania a aktualizacją katalogu, mogą oni (RCM) założyć, że istnieje prawdziwy problem związany z woluminami pamięci i zatrzymać aktualizację, aby go zbadać. Jeśli jednak inżynier przeprowadzający aktualizację nie jest pewien lub ma pytania dotyczące tej sytuacji, należy skontaktować się z pomocą techniczną VPLEX.
W przypadku produktu AppSync, ponieważ wysyła on zapytanie o status woluminu pamięci VPLEX, jeśli otrzyma odpowiedź „unknown”, może to spowodować problemy operacyjne.

Obejście:
w przypadku, gdy nie jest możliwe działanie z niedopasowanym oprogramowaniem wewnętrznym, należy skontaktować się z działem pomocy technicznej Dell EMC VPLEX z prośbą o dalszą pomoc i wspomnieć o tym artykule.

VPLEX: Woluminy pamięci zgłaszają „Operational Status” i „Health State” jako „unknown”

Summary: Niedopasowanie wersji między serwerem zarządzania a katalogami powoduje, że wszystkie woluminy pamięci zgłaszają „Operational Status” i „Health State” jako „unknown”.

Article Content

Symptoms

Cause

Resolution

Article Properties

Affected Product

Last Published Date

Version

Article Type

Welcome

Welcome to Dell

VPLEX: Woluminy pamięci zgłaszają „Operational Status” i „Health State” jako „unknown”

Summary: Niedopasowanie wersji między serwerem zarządzania a katalogami powoduje, że wszystkie woluminy pamięci zgłaszają „Operational Status” i „Health State” jako „unknown”.

Article Content

Symptoms

Cause

Resolution

Article Properties

Affected Product

Last Published Date

Version

Article Type