PowerScale: "NFS: v4-servern returnerade ett felaktigt sekvens-id-fel för en obekräftad sekvens".
Summary: OneFS 9.3 och OneFS 9.4: NFSv4-klienten rapporterar fel: "NFS: v4-servern returnerade ett felaktigt sekvens-id-fel för en obekräftad sekvens". Vid paketinsamlingar ser Dell Technologies även följande fel: NFS4ERR_NO_GRACE ...
Symptoms
PowerScale finns på OneFS 9.3 eller 9.4 och NFSv4-klienter rapporterar fel av följande typ:
Nov 18 13:00:22 kernel: NFS: v4 server returned a bad sequence-id error on an unconfirmed sequence 00000000c6d21f3b!
Nov 18 13:00:22 kernel: NFS: nfs4_reclaim_open_state: unhandled error -10026
Nov 18 13:00:22 kernel: NFSv4: state recovery failed for open file /test2.txt, error = -10026
När dessa fel visas kraschar programmet som har åtkomst till NFS-filsystemet, så det påverkar produktionen och kräver manuella åtgärder några gånger per dag.
Även efter att NFS-klienterna har startats om rapporterar klienterna fortfarande felen.
I klient- eller nodpaketinsamlingarna kan du också se följande fel:
PCAP:
41 13:00:11.313563 10.205.224.32 10.205.224.12 NFS 302 V4 Call (Reply In 42) OPEN DH: 0x1eb1379b/
42 13:00:11.313804 10.205.224.12 10.205.224.32 NFS 122 V4 Reply (Call In 41) OPEN Status: NFS4ERR_NO_GRACE
43 13:00:11.314731 10.205.224.32 10.205.224.12 NFS 330 V4 Call (Reply In 44) OPEN DH: 0xa07785fa/test2.txt
44 13:00:11.314911 10.205.224.12 10.205.224.32 NFS 122 V4 Reply (Call In 43) OPEN Status: NFS4ERR_BAD_SEQIDCause
Det här problemet orsakas av ett känt fel: PSCALE-162845: Godta ett inkrementellt sekvens-id för den föregående transaktionen som har NFS4ERR_NO_GRACE or NFS4ERR_GRACE .
Alla versioner av NFSv4 påverkas, inte bara 4.1 och 4.2.
Detaljer om defekten är som följer:
Klienten ökar sitt sekvens-ID när OneFS inte förväntar sig att de ska göra det. Det innebär att OneFS inte ökar sekvens-id:t korrekt.
NFS-klienten verkar monotont öka sekvensnumret för OPEN/CLOSE/other verksamhet, inbegripet NFS4ERR_NO_GRACE och NFS4ERR_GRACE . PowerScale tillåter dock inte det ökade sekvens-ID:t om den föregående åtgärden påträffade NFS4ERR_NO_GRACE or NFS4ERR_GRACE . Anta därför att PowerScale returnerar NFS4ERR_NO_GRACE/NFS4ERR_GRACE fel för en tidigare åtgärd. Detta leder till NFS4ERR_BAD_SEQID för nästa inkommande åtgärd eftersom PowerScale inte förväntar sig ett ökat sekvens-ID.
Enligt NFSv4 RFCfinns det ingen definition av NFS4ERR_NO_GRACE/NFS4ERR_GRACE för att inte tillåta inkrementella värden.
Det finns en skillnad mellan Linux och PowerScale när det gäller inkrementell sekvens-ID-logik för NFS4ERR_NO_GRACE Fel. Låt oss därför tillåta en ökning av seqence-id i Isilon-kod för att anpassa sig till Linux-kod.
Resolution
Lösningen är att flytta arbetsflödet till NFSv3.
ELLER
installera korrigeringsfil:GA: PSP-3035 PATCH: [9.4.0.11_GA-RUP_2023-01][Multiple User space and Kernel Fixes](January 2023)DA: PSP-3069 PATCH: [9.4.0.10_DA-CUSTOM_2022-12][9.4.0.10_GA-RUP_2022-12 + NFS Fix](VMWARE)