PowerScale : « NFS : le serveur v4 a renvoyé une erreur d’ID de séquence incorrecte sur une séquence non confirmée ».
Summary: OneFS 9.3 et OneFS 9.4 : Le client NFSv4 signale une erreur : « NFS : le serveur v4 a renvoyé une erreur d’ID de séquence incorrecte sur une séquence non confirmée ». Dans les captures de paquets, Dell Technologies voit également l’erreur suivante : NFS4ERR_NO_GRACE ...
Symptoms
PowerScale est sur OneFS 9.3 ou 9.4, et les clients NFSv4 signalent des erreurs semblables aux suivantes :
Nov 18 13:00:22 kernel: NFS: v4 server returned a bad sequence-id error on an unconfirmed sequence 00000000c6d21f3b!
Nov 18 13:00:22 kernel: NFS: nfs4_reclaim_open_state: unhandled error -10026
Nov 18 13:00:22 kernel: NFSv4: state recovery failed for open file /test2.txt, error = -10026
Lorsque ces erreurs apparaissent, l’application accédant au système de fichiers NFS se bloque. Cela affecte la production et nécessite une intervention manuelle plusieurs fois par jour.
Même après le redémarrage, les clients NFS signalent toujours les erreurs.
Dans les captures de paquets du client ou du nœud, vous pouvez également voir les erreurs suivantes :
PCAP:
41 13:00:11.313563 10.205.224.32 10.205.224.12 NFS 302 V4 Call (Reply In 42) OPEN DH: 0x1eb1379b/
42 13:00:11.313804 10.205.224.12 10.205.224.32 NFS 122 V4 Reply (Call In 41) OPEN Status: NFS4ERR_NO_GRACE
43 13:00:11.314731 10.205.224.32 10.205.224.12 NFS 330 V4 Call (Reply In 44) OPEN DH: 0xa07785fa/test2.txt
44 13:00:11.314911 10.205.224.12 10.205.224.32 NFS 122 V4 Reply (Call In 43) OPEN Status: NFS4ERR_BAD_SEQIDCause
Ce problème est dû à un défaut connu : PSCALE-162845: Acceptez l’ID de séquence incrémenté pour l’opération précédente ayant NFS4ERR_NO_GRACE or NFS4ERR_GRACE d’erreur clavier.
Toutes les versions de NFSv4 sont concernées, pas seulement les versions 4.1 et 4.2.
Les détails du défaut sont les suivants :
Le client incrémente son ID de séquence alors que OneFS ne s’y attend pas. Par conséquent, OneFS n’incrémente pas correctement l’ID de séquence.
Le client NFS semble incrémenter de façon monotone le numéro de séquence de OPEN/CLOSE/other d’autres opérations, y compris la NFS4ERR_NO_GRACE et NFS4ERR_GRACE d’erreur clavier. Toutefois, PowerScale n’autorise pas l’ID de séquence incrémentée si l’opération précédente a rencontré NFS4ERR_NO_GRACE or NFS4ERR_GRACE d’erreur clavier. Par conséquent, supposons que PowerScale renvoie le NFS4ERR_NO_GRACE/NFS4ERR_GRACE Erreur d’une opération précédente. Cela conduit à NFS4ERR_BAD_SEQID pour l’opération entrante suivante, car PowerScale ne s’attend pas à un ID de séquence incrémenté.
Conformément à NFSv4 RFC, il n’y a pas de définition de NFS4ERR_NO_GRACE/NFS4ERR_GRACE pour interdire les valeurs incrémentées.
Il existe une distinction entre Linux et PowerScale en ce qui concerne l’incrémentation de la logique d’ID de séquence pour NFS4ERR_NO_GRACE Erreurs. Par conséquent, permettons l’incrémentation de seqence-id dans le code Isilon pour s’aligner sur le code Linux.
Resolution
La solution de contournement consiste à déplacer le workflow vers NFSv3.
OU
installez le correctif :GA: PSP-3035 PATCH: [9.4.0.11_GA-RUP_2023-01][Multiple User space and Kernel Fixes](January 2023)DA: PSP-3069 PATCH: [9.4.0.10_DA-CUSTOM_2022-12][9.4.0.10_GA-RUP_2022-12 + NFS Fix](VMWARE)