PowerScale: Systém OneFS při restartování uzlu ztratí zámky NFSv4
Summary: Klienti NFSv4 mohou ztratit zámky nebo nemusí být po restartování uzlu schopni správně uvolnit zámky.
Symptoms
Tento problém se vyskytuje ve všech verzích systému OneFS před opravou vývoje.
Může ovlivnit libovolnou aplikaci, která používá NFSv4, a operace uzamčení.
K tomuto problému nejčastěji dochází u aplikací typu "Message Queue", jako je ActiveMQ nebo OpenMQ, které využívají rozsáhlé uzamykací mechanismy NFSv4.
Pro aplikace MQ; Často se projeví jako sekundární server MQ, který přebírá řízení za primární, když by neměl.
To způsobí výpadky nebo nekonzistenci dat, které k vyřešení vyžadují ruční zásah na straně aplikace.
Pokud je zaznamenán v záznamech paketů, klient soubor úspěšně uzamkne, zatímco se k němu druhý klient pokusí o přístup.
Když se uzel, ke kterému je zamykací klient připojen k restartování, mu je zamykacímu klientovi přidělen zámek.
První klient obdrží chybu na konci zámku, protože už nemá zámek.
Problém lze reprodukovat následovně:
- Na prvním klientovi připojte export pomocí nástroje NFSv4.0.
- Na druhém klientovi připojte stejný export pomocí verze NFSv4.0.
- Na prvním klientovi uzamkněte soubor po dobu 5 minut.
- Na druhém klientovi spusťte smyčku, která se pokusí uzamknout stejný soubor.
- Restartujte uzel OneFS, ke kterému je připojen první klient.
- Pokud k problému dochází, druhému klientovi je před ukončením prvního zámku klienta přidělen zámek.
Cause
V naší logice došlo k chybě při přesunu připojení NFSv4 do jiných uzlů, která způsobila uvolnění zámků při restartování uzlu.
Resolution
Opravit:
Proveďte upgrade nebo opravu na jednu z následujících verzí systému OneFS.
- 9.1.0.19+
- 9.2.1.12+
- 9.4.0.3+
- 9.5.0.0+
Řešení:
K tomuto problému neexistuje žádné náhradní řešení.