PowerScale: OneFS menettää NFSv4-lukituksen solmun uudelleenkäynnistyksen yhteydessä
Summary: NFSv4-työasemat saattavat menettää lukituksen tai eivät voi vapauttaa lukkoja oikein solmun uudelleenkäynnistyksen jälkeen.
Symptoms
Ongelma on kaikissa OneFS-versioissa ennen sen korjaamista.
Se voi vaikuttaa mihin tahansa sovellukseen, joka käyttää NFSv4:ää ja lukitustoimintoja.
Ongelma on useimmiten havaittu Message Queue -sovelluksissa, kuten ActiveMQ- tai OpenMQ-sovelluksissa, koska niissä käytetään laajamittaisia NFSv4-lukitusmekanismeja.
MQ-sovelluksille Se ilmenee usein toissijaisena MQ-palvelimena, joka ottaa ensisijaisen aseman haltuunsa, vaikka sen ei pitäisi.
Tämä aiheuttaa käyttökatkoksia tai tietojen epäyhtenäisyyksiä, joiden korjaaminen edellyttää sovelluksen manuaalista toimintaa.
Kun pakettien tallennukset havaitaan, työasema lukitsee tiedoston onnistuneesti, kun toinen asiakas yrittää käyttää sitä.
Kun lukitusohjelma on yhdistetty solmuun, toiselle työasemalle myönnetään lukitus.
Ensimmäinen työasema saa virheilmoituksen, kun lukko päättyy, koska lukitusta ei enää ole.
Ongelman voi toistaa seuraavasti:
- Ota vienti käyttöön ensimmäisessä työasemassa NFSv4.0:lla.
- Ota sama vienti käyttöön toisessa työasemassa NFSv4.0:lla.
- Lukitse tiedosto ensimmäisessä työasemassa 5 minuutiksi.
- Käynnistä toisessa työasemassa silmukka, joka yrittää lukita saman tiedoston.
- Käynnistä uudelleen OneFS-solmu, johon ensimmäinen työasema on liitetty.
- Jos ongelma ilmenee, toiselle työasemalle myönnetään lukko, ennen kuin ensimmäinen työasemalukko päättyy.
Cause
Logiikassamme näkyi virhe, joka koskee NFSv4-yhteyksien siirtämistä muihin solmuihin, mikä aiheutti lukkojen vapauttamisen solmun uudelleenkäynnistyksen yhteydessä.
Resolution
Korjata:
Päivitä tai korjaa jokin seuraavista OneFS-versioista.
- 9.1.0.19+
- 9.2.1.12+
- 9.4.0.3+
- 9.5.0.0+
Workaround:
Ongelmaan ei ole kiertotapoja.