PowerScale: "NFS: il server v4 ha restituito un errore di ID sequenza errato su una sequenza non confermata".
Summary: OneFS 9.3 e OneFS 9.4: Il client NFSv4 segnala l'errore: "NFS: il server v4 ha restituito un errore di ID sequenza errato su una sequenza non confermata". Nelle acquisizioni dei pacchetti, Dell Technologies rileva anche il seguente errore: NFS4ERR_NO_GRACE ...
Symptoms
PowerScale è su OneFS 9.3 o 9.4 e i client NFSv4 segnalano errori come quelli riportati di seguito:
Nov 18 13:00:22 kernel: NFS: v4 server returned a bad sequence-id error on an unconfirmed sequence 00000000c6d21f3b!
Nov 18 13:00:22 kernel: NFS: nfs4_reclaim_open_state: unhandled error -10026
Nov 18 13:00:22 kernel: NFSv4: state recovery failed for open file /test2.txt, error = -10026
Quando vengono visualizzati questi errori, l'applicazione che accede al file system NFS si arresta in modo anomalo, quindi influisce sulla produzione e richiede un intervento manuale alcune volte al giorno.
Anche dopo il riavvio, i client NFS continuano a segnalare gli errori.
Nelle acquisizioni dei pacchetti del client o del nodo è possibile visualizzare anche i seguenti errori:
PCAP:
41 13:00:11.313563 10.205.224.32 10.205.224.12 NFS 302 V4 Call (Reply In 42) OPEN DH: 0x1eb1379b/
42 13:00:11.313804 10.205.224.12 10.205.224.32 NFS 122 V4 Reply (Call In 41) OPEN Status: NFS4ERR_NO_GRACE
43 13:00:11.314731 10.205.224.32 10.205.224.12 NFS 330 V4 Call (Reply In 44) OPEN DH: 0xa07785fa/test2.txt
44 13:00:11.314911 10.205.224.12 10.205.224.32 NFS 122 V4 Reply (Call In 43) OPEN Status: NFS4ERR_BAD_SEQIDCause
Questo problema è causato da un difetto noto: PSCALE-162845: Accettare l'ID sequenza incrementato per l'operazione precedente con NFS4ERR_NO_GRACE or NFS4ERR_GRACE trovata.
Sono interessate tutte le versioni di NFSv4, non solo la 4.1 e la 4.2.
I dettagli relativi al difetto sono i seguenti:
Il client incrementa il proprio ID sequenza quando OneFS non si aspetta che lo faccia. Pertanto, OneFS non incrementa correttamente l'ID della sequenza.
Sembra che il client NFS incrementi in modo monotono il numero di sequenza per OPEN/CLOSE/other operazioni, compresa la NFS4ERR_NO_GRACE e NFS4ERR_GRACE trovata. Tuttavia, PowerScale non consente l'ID della sequenza incrementata se l'operazione precedente ha riscontrato il NFS4ERR_NO_GRACE or NFS4ERR_GRACE trovata. Pertanto, supponiamo che PowerScale restituisca il NFS4ERR_NO_GRACE/NFS4ERR_GRACE Errore per un'operazione precedente. Questo porta a NFS4ERR_BAD_SEQID per la successiva operazione in ingresso, poiché PowerScale non prevede un ID sequenza incrementato.
In base alle NFSv4 RFC, non esiste una definizione di NFS4ERR_NO_GRACE/NFS4ERR_GRACE per disabilitare i valori incrementati.
Esiste una distinzione tra Linux e PowerScale per quanto riguarda la logica dell'ID della sequenza incrementale per NFS4ERR_NO_GRACE Errori. Perciò permettiamo l'incremento del seqence-id nel codice Isilon per allinearsi al codice Linux.
Resolution
La soluzione alternativa consiste nello spostare il flusso di lavoro in NFSv3.
OPPURE installare la
patch:GA: PSP-3035 PATCH: [9.4.0.11_GA-RUP_2023-01][Multiple User space and Kernel Fixes](January 2023)DA: PSP-3069 PATCH: [9.4.0.10_DA-CUSTOM_2022-12][9.4.0.10_GA-RUP_2022-12 + NFS Fix](VMWARE)