PowerScale: "NFS: v4-Server hat einen ungültigen Sequenz-ID-Fehler für eine unbestätigte Sequenz zurückgegeben."
Zusammenfassung: OneFS 9.3 und OneFS 9.4: NFSv4-Client meldet Fehler: "NFS: v4-Server hat einen ungültigen Sequenz-ID-Fehler für eine unbestätigte Sequenz zurückgegeben." Bei der Paketerfassung wird Dell Technologies auch der folgende Fehler angezeigt: NFS4ERR_NO_GRACE ...
Symptome
PowerScale wird auf OneFS 9.3 oder 9.4 ausgeführt und NFSv4-Clients melden Fehler wie die folgenden:
Nov 18 13:00:22 kernel: NFS: v4 server returned a bad sequence-id error on an unconfirmed sequence 00000000c6d21f3b!
Nov 18 13:00:22 kernel: NFS: nfs4_reclaim_open_state: unhandled error -10026
Nov 18 13:00:22 kernel: NFSv4: state recovery failed for open file /test2.txt, error = -10026
Wenn diese Fehler auftreten, stürzt die Anwendung, die auf das NFS-Dateisystem zugreift, ab, sodass die Produktion beeinträchtigt wird und mehrmals täglich manuelle Intervention erforderlich ist.
Auch nach dem Neustart der NFS-Clients melden die Clients weiterhin die Fehler.
In den Client- oder Node-Paketerfassungen werden möglicherweise auch die folgenden Fehler angezeigt:
PCAP:
41 13:00:11.313563 10.205.224.32 10.205.224.12 NFS 302 V4 Call (Reply In 42) OPEN DH: 0x1eb1379b/
42 13:00:11.313804 10.205.224.12 10.205.224.32 NFS 122 V4 Reply (Call In 41) OPEN Status: NFS4ERR_NO_GRACE
43 13:00:11.314731 10.205.224.32 10.205.224.12 NFS 330 V4 Call (Reply In 44) OPEN DH: 0xa07785fa/test2.txt
44 13:00:11.314911 10.205.224.12 10.205.224.32 NFS 122 V4 Reply (Call In 43) OPEN Status: NFS4ERR_BAD_SEQIDUrsache
Dieses Problem wird durch einen bekannten Fehler verursacht: PSCALE-162845verwalten: Inkrementierte Sequenz-ID für den vorherigen Vorgang akzeptieren mit NFS4ERR_NO_GRACE or NFS4ERR_GRACE Fehlers
Betroffen sind alle Versionen von NFSv4, nicht nur 4.1 und 4.2.
Die Details zum Fehler lauten wie folgt:Der Client erhöht seine Sequenz-ID,
obwohl OneFS dies nicht erwartet. Daher inkrementiert OneFS die Sequenz-ID nicht korrekt.
Der NFS-Client scheint die Sequenznummer für OPEN/CLOSE/other Operationen, einschließlich der NFS4ERR_NO_GRACE und NFS4ERR_GRACE Fehlers PowerScale lässt die inkrementierte Sequenz-ID jedoch nicht zu, wenn beim vorherigen Vorgang das NFS4ERR_NO_GRACE or NFS4ERR_GRACE Fehlers Nehmen wir daher an, PowerScale gibt den NFS4ERR_NO_GRACE/NFS4ERR_GRACE Fehler für einen vorherigen Vorgang. Dies führt zu NFS4ERR_BAD_SEQID für den nächsten eingehenden Vorgang, da PowerScale keine inkrementierte Sequenz-ID erwartet.
Gemäß NFSv4 RFCgibt es keine Definition für NFS4ERR_NO_GRACE/NFS4ERR_GRACE , um inkrementierte Werte nicht zuzulassen.
Linux und PowerScale unterscheiden sich hinsichtlich der inkrementellen Sequenz-ID-Logik für NFS4ERR_NO_GRACE Fehler. Lassen wir daher die Erhöhung der seqence-id im Isilon-Code zur Ausrichtung an Linux-Code.
Lösung
Die Problemumgehung besteht darin, den Workflow zu NFSv3 zu verschieben.
ODER
Patch installieren:GA: PSP-3035 PATCH: [9.4.0.11_GA-RUP_2023-01][Multiple User space and Kernel Fixes](January 2023)DA: PSP-3069 PATCH: [9.4.0.10_DA-CUSTOM_2022-12][9.4.0.10_GA-RUP_2022-12 + NFS Fix](VMWARE)