PowerScale: 'NFS: v4-serveren returnerte en dårlig sekvens-id-feil på en ubekreftet sekvens'.
Summary: OneFS 9.3 og OneFS 9.4: NFSv4-klienten rapporterer feil: 'NFS: v4-serveren returnerte en dårlig sekvens-id-feil på en ubekreftet sekvens'. I pakkeregistreringer ser Dell Technologies også følgende feil: NFS4ERR_NO_GRACE ...
Symptoms
PowerScale er på OneFS 9.3 eller 9.4, og NFSv4-klienter rapporterer feil som følgende:
Nov 18 13:00:22 kernel: NFS: v4 server returned a bad sequence-id error on an unconfirmed sequence 00000000c6d21f3b!
Nov 18 13:00:22 kernel: NFS: nfs4_reclaim_open_state: unhandled error -10026
Nov 18 13:00:22 kernel: NFSv4: state recovery failed for open file /test2.txt, error = -10026
Når disse feilene vises, krasjer applikasjonen som får tilgang til NFS-filsystemet, så det påvirker produksjonen og krever manuell inngrep noen ganger om dagen.
Selv etter at NFS-klientene har blitt startet på nytt, rapporterer klientene fortsatt feilene.
I klient- eller nodepakkeregistreringene kan du også se følgende feil:
PCAP:
41 13:00:11.313563 10.205.224.32 10.205.224.12 NFS 302 V4 Call (Reply In 42) OPEN DH: 0x1eb1379b/
42 13:00:11.313804 10.205.224.12 10.205.224.32 NFS 122 V4 Reply (Call In 41) OPEN Status: NFS4ERR_NO_GRACE
43 13:00:11.314731 10.205.224.32 10.205.224.12 NFS 330 V4 Call (Reply In 44) OPEN DH: 0xa07785fa/test2.txt
44 13:00:11.314911 10.205.224.12 10.205.224.32 NFS 122 V4 Reply (Call In 43) OPEN Status: NFS4ERR_BAD_SEQIDCause
Dette problemet skyldes en kjent feil: PSCALE-162845: Godta økt sekvens-ID for den forrige operasjonen med NFS4ERR_NO_GRACE or NFS4ERR_GRACE feil.
Alle versjoner av NFSv4 påvirkes, ikke bare 4.1 og 4.2.
Detaljer om feilen er som følger:
Klienten øker sekvens-ID-en når OneFS ikke forventer at de skal gjøre det. Dermed øker ikke OneFS sekvens-ID-en riktig.
NFS-klienten ser ut til å øke sekvensnummeret monotont for OPEN/CLOSE/other operasjoner inkludert NFS4ERR_NO_GRACE og NFS4ERR_GRACE feil. Men PowerScale tillater ikke den trinnvise sekvens-ID-en hvis den forrige operasjonen oppdaget NFS4ERR_NO_GRACE or NFS4ERR_GRACE feil. Anta derfor at PowerScale returnerer NFS4ERR_NO_GRACE/NFS4ERR_GRACE feil for en tidligere operasjon. Dette fører til NFS4ERR_BAD_SEQID for neste innkommende operasjon fordi PowerScale ikke forventer en trinnvis sekvens-ID.
I henhold til NFSv4 RFC, er det ingen definisjon for NFS4ERR_NO_GRACE/NFS4ERR_GRACE for ikke å tillate økte verdier.
Det skilles mellom Linux og PowerScale når det gjelder økning av sekvens-id-logikk for NFS4ERR_NO_GRACE Feil. La oss derfor tillate økning av seqence-id i Isilon-kode for å justere med Linux-kode.
Resolution
Løsningen er å flytte arbeidsflyten til NFSv3.
ELLER
installer oppdateringen:GA: PSP-3035 PATCH: [9.4.0.11_GA-RUP_2023-01][Multiple User space and Kernel Fixes](January 2023)DA: PSP-3069 PATCH: [9.4.0.10_DA-CUSTOM_2022-12][9.4.0.10_GA-RUP_2022-12 + NFS Fix](VMWARE)