PowerScale. «NFS: сервер v4 вернул ошибку неверного идентификатора последовательности для неподтвержденной последовательности».
Summary: OneFS 9.3 и OneFS 9.4. Клиент NFSv4 сообщает об ошибке: «NFS: сервер v4 вернул ошибку неверного идентификатора последовательности для неподтвержденной последовательности». При захвате пакетов Dell Technologies также видит следующую ошибку: NFS4ERR_NO_GRACE ...
Symptoms
PowerScale работает под управлением OneFS 9.3 или 9.4, и клиенты NFSv4 сообщают об ошибках, указанных ниже.
Nov 18 13:00:22 kernel: NFS: v4 server returned a bad sequence-id error on an unconfirmed sequence 00000000c6d21f3b!
Nov 18 13:00:22 kernel: NFS: nfs4_reclaim_open_state: unhandled error -10026
Nov 18 13:00:22 kernel: NFSv4: state recovery failed for open file /test2.txt, error = -10026
При появлении этих ошибок происходит сбой приложения, обращающегося к файловой системе NFS. Это влияет на производственную среду и требует ручного вмешательства несколько раз в день.
Даже после перезагрузки клиенты NFS продолжают сообщать об ошибках.
При захвате пакетов клиента или узла также могут отображаться следующие ошибки:
PCAP:
41 13:00:11.313563 10.205.224.32 10.205.224.12 NFS 302 V4 Call (Reply In 42) OPEN DH: 0x1eb1379b/
42 13:00:11.313804 10.205.224.12 10.205.224.32 NFS 122 V4 Reply (Call In 41) OPEN Status: NFS4ERR_NO_GRACE
43 13:00:11.314731 10.205.224.32 10.205.224.12 NFS 330 V4 Call (Reply In 44) OPEN DH: 0xa07785fa/test2.txt
44 13:00:11.314911 10.205.224.12 10.205.224.32 NFS 122 V4 Reply (Call In 43) OPEN Status: NFS4ERR_BAD_SEQIDCause
Эта проблема вызвана известным дефектом: PSCALE-162845. Принять инкрементный идентификатор последовательности для предыдущей операции, содержащей NFS4ERR_NO_GRACE or NFS4ERR_GRACE .
Проблеме подвержены все версии NFSv4, а не только 4.1 и 4.2.
Ниже приведены подробные сведения о дефекте. Клиент увеличивает идентификатор последовательности,
когда OneFS этого не ожидает. Таким образом, OneFS неправильно увеличивает идентификатор последовательности.
По-видимому, клиент NFS монотонно увеличивает порядковый номер для OPEN/CLOSE/other операции, в том числе NFS4ERR_NO_GRACE и NFS4ERR_GRACE . Но PowerScale не разрешает инкрементный идентификатор последовательности, если предыдущая операция обнаружила, что NFS4ERR_NO_GRACE or NFS4ERR_GRACE . Таким образом, предположим, что PowerScale возвращает NFS4ERR_NO_GRACE/NFS4ERR_GRACE Ошибка за предыдущую операцию. Это приводит к тому, что NFS4ERR_BAD_SEQID для следующей входящей операции, так как PowerScale не ожидает увеличения идентификатора последовательности.
В соответствии с NFSv4 RFC, не существует определения для NFS4ERR_NO_GRACE/NFS4ERR_GRACE , чтобы запретить увеличение значений.
Между Linux и PowerScale существуют различия в отношении логики увеличения идентификатора последовательности для NFS4ERR_NO_GRACE Ошибки. Следовательно, допустим приращение seqence-id в коде Isilon для согласования с кодом Linux.
Resolution
Временное решение заключается в переводе рабочего процесса на NFSv3.
ИЛИ
установите исправление:GA: PSP-3035 PATCH: [9.4.0.11_GA-RUP_2023-01][Multiple User space and Kernel Fixes](January 2023)DA: PSP-3069 PATCH: [9.4.0.10_DA-CUSTOM_2022-12][9.4.0.10_GA-RUP_2022-12 + NFS Fix](VMWARE)