PowerScale: OneFS mister NFSv4-låse ved nodegenstart
Summary: NFSv4-klienter kan miste låse eller låse korrekt efter nodegenstart.
Symptoms
Dette problem findes i alle OneFS-versioner før udviklingen.
Det kan påvirke ethvert program, der bruger NFSv4 og låsehandlinger.
Dette problem er oftest observeret med "Meddelelseskø"-programmer som f.eks. ActiveMQ eller OpenMQ, da de gør omfattende brug af NFSv4-låsemekanismer.
For MQ-programmer. den manifesterer sig ofte som en sekundær MQ-server, der overtager den primære, når den ikke bør.
Dette medfører udfald eller datakonsistenser, der kræver manuel indgriben på programsiden for at løse problemet.
Når det observeres i pakkehentninger, låser klienten en fil korrekt, mens en anden klient forsøger at få adgang til den.
Når noden låseklienten er forbundet til genstarter, får den anden klient tildelt låsen.
Den første klient modtager en fejl, når låsen slutter, da den ikke længere har låsen.
Problemet kan genskabes på følgende måde:
- På den første klient skal du tilslutte en eksport vha. NFSv4.0.
- På den anden klient skal du tilslutte den samme eksport ved hjælp af NFSv4.0.
- På den første klient skal du låse en fil i 5 minutter.
- På den anden klient skal du starte en løkke, der forsøger at låse den samme fil.
- Genstart den OneFS-node, som den første klient er tilsluttet.
- Hvis problemet opstår, får den anden klient tildelt en lås, før den første klientlås slutter.
Cause
Der opstod en fejl i vores logik ved flytning af NFSv4-forbindelser til andre noder, der forårsagede, at låsene blev frigivet ved genstart af noden.
Resolution
Lave:
Opgrader eller patch til en af følgende versioner af OneFS.
- 9.1.0.19+
- 9.2.1.12+
- 9.4.0.3+
- 9.5.0.0+
Løsning:
Der er ingen løsninger på dette problem.