PowerScale: "NFS: el servidor v4 devolvió un error de ID de secuencia incorrecta en una secuencia no confirmada".
Summary: OneFS 9.3 y OneFS 9.4: El cliente NFSv4 informa un error: "NFS: el servidor v4 devolvió un error de ID de secuencia incorrecta en una secuencia no confirmada". En las capturas de paquetes, Dell Technologies también observa el siguiente error: NFS4ERR_NO_GRACE ...
Symptoms
PowerScale está en OneFS 9.3 o 9.4 y los clientes NFSv4 informan errores como los siguientes:
Nov 18 13:00:22 kernel: NFS: v4 server returned a bad sequence-id error on an unconfirmed sequence 00000000c6d21f3b!
Nov 18 13:00:22 kernel: NFS: nfs4_reclaim_open_state: unhandled error -10026
Nov 18 13:00:22 kernel: NFSv4: state recovery failed for open file /test2.txt, error = -10026
Cuando aparecen estos errores, la aplicación que accede al sistema de archivos NFS se bloquea, por lo que afecta la producción y requiere intervención manual algunas veces al día.
Incluso después de que se hayan reiniciado los clientes NFS, los clientes siguen informando los errores.
En las capturas de paquetes de clientes o nodos, también puede ver los siguientes errores:
PCAP:
41 13:00:11.313563 10.205.224.32 10.205.224.12 NFS 302 V4 Call (Reply In 42) OPEN DH: 0x1eb1379b/
42 13:00:11.313804 10.205.224.12 10.205.224.32 NFS 122 V4 Reply (Call In 41) OPEN Status: NFS4ERR_NO_GRACE
43 13:00:11.314731 10.205.224.32 10.205.224.12 NFS 330 V4 Call (Reply In 44) OPEN DH: 0xa07785fa/test2.txt
44 13:00:11.314911 10.205.224.12 10.205.224.32 NFS 122 V4 Reply (Call In 43) OPEN Status: NFS4ERR_BAD_SEQIDCause
Este problema se debe a un defecto conocido: PSCALE-162845: Acepte el ID de secuencia incrementado para la operación anterior que tiene NFS4ERR_NO_GRACE or NFS4ERR_GRACE Error.
Todas las versiones de NFSv4 se ven afectadas, no solo la 4.1 y la 4.2.
Los detalles sobre el defecto son los siguientes:
El cliente está incrementando su ID de secuencia cuando OneFS no espera que lo hagan. Por lo tanto, OneFS no incrementa el ID de secuencia correctamente.
El cliente NFS parece incrementar monótonamente el número de secuencia para OPEN/CLOSE/other operaciones que incluyen la NFS4ERR_NO_GRACE y NFS4ERR_GRACE Error. Sin embargo, PowerScale no permite el id de secuencia incrementado si la operación anterior encontró el NFS4ERR_NO_GRACE or NFS4ERR_GRACE Error. Por lo tanto, supongamos que PowerScale devuelve la propiedad NFS4ERR_NO_GRACE/NFS4ERR_GRACE Error para una operación anterior. Esto lleva a NFS4ERR_BAD_SEQID para la siguiente operación entrante, ya que PowerScale no espera un ID de secuencia incrementado.
De acuerdo con NFSv4 RFC, no existe una definición de NFS4ERR_NO_GRACE/NFS4ERR_GRACE para no permitir valores incrementados.
Existe una distinción entre Linux y PowerScale con respecto al incremento de la lógica de ID de secuencia para NFS4ERR_NO_GRACE errores. Por lo tanto, permitamos el incremento de seqence-id en el código de Isilon para alinearse con el código de Linux.
Resolution
La solución alternativa es transferir el flujo de trabajo a NFSv3.
O
instale el parche:GA: PSP-3035 PATCH: [9.4.0.11_GA-RUP_2023-01][Multiple User space and Kernel Fixes](January 2023)DA: PSP-3069 PATCH: [9.4.0.10_DA-CUSTOM_2022-12][9.4.0.10_GA-RUP_2022-12 + NFS Fix](VMWARE)