Dell Unity: Los nombres de host duplicados causan problemas de rendimiento en el entorno NFSv4 (corregible por el usuario)
Resumen: Los clientes NFSv4.1 que comparten el mismo nombre de host pueden experimentar terminaciones y recreaciones frecuentes de sesiones. Esto ocurre porque el protocolo NFSv4.1 utiliza el nombre de host como parte del identificador de cliente único (propietario del cliente). Cuando varios hosts utilizan el mismo identificador, el servidor de almacenamiento (p. ej., Dell Unity) los percibe como el mismo cliente que intenta restablecer una conexión, lo que provoca un bucle de "inestabilidad de sesión" y posibles bloqueos de I/O. ...
Síntomas
Lado del cliente: Los usuarios informan una degradación significativa del rendimiento de NFS, específicamente una alta latencia durante las operaciones de archivos pequeños.
Lado de Unity: El registro muestra que el servidor NAS se activa con frecuencia checkReplay lógica, lo que indica que está recibiendo solicitudes con ID de secuencia (seqid) que, a su juicio, ya han sido procesados.
2026/03/23-09:22:31.571765 3 7FCE8B3CF705 sade:NFS: 3:[NAS_server] checkReplay: sequence replay slotid 0 seqid 0x2
2026/03/23-09:22:31.571948 177 7FCE8AB4F703 sade:NFS: 3:[NAS_server] checkReplay: sequence replay slotid 0 seqid 0x3
2026/03/23-09:22:31.571969 15 7FCE8AE7F701 sade:NFS: 3:[NAS_server] checkReplay: sequence replay slotid 1 seqid 0x1
2026/03/23-09:22:33.950467 94K 7FCE8E57B703 sade:NFS: 3:[NAS_server] checkReplay: sequence replay slotid 0 seqid 0x1
2026/03/23-09:22:33.950614 142 7FCE8E24F702 sade:NFS: 3:[NAS_server] checkReplay: sequence replay slotid 0 seqid 0x2
2026/03/23-09:22:33.950780 159 7FCE8DEDA705 sade:NFS: 3:[NAS_server] checkReplay: sequence replay slotid 0 seqid 0x3
2026/03/23-09:22:33.950793 8 7FCE8E22A702 sade:NFS: 3:[NAS_server] checkReplay: sequence replay slotid 1 seqid 0x1
2026/03/23-09:22:36.025980 169K 7FCE8C9FD704 sade:NFS: 3:[NAS_server] checkReplay: sequence replay slotid 0 seqid 0x1
2026/03/23-09:22:36.026291 305 7FCE8C9B9704 sade:NFS: 3:[NAS_server] checkReplay: sequence replay slotid 0 seqid 0x3
Red: Las capturas de paquetes identifican una colisión de ID de cliente entre varias direcciones IP distintas (10.10.1.8 y 10.10.1.3). Ambos hosts están intentando registrarse en el servidor NFS con el mismo identificador de cliente. Esto provoca una condición de carrera en la que un cliente invalida la sesión del otro, lo que provoca errores de secuencia y un retraso de recuperación de 1 segundo que degrada el rendimiento.
42855 2026-03-20 02:34:12.752931 10.10.1.3 10.10.1.50 NFS 294 V4 Call (Reply In 42856) CLOSE StateID: 0x97d3
42856 2026-03-20 02:34:12.753069 10.10.1.50 10.10.1.3 NFS 182 V4 Reply (Call In 42855) CLOSE
42857 2026-03-20 02:34:12.753542 10.10.1.50 10.10.1.3 NFS 562 V4 Reply (Call In 42837) OPEN StateID: 0x3dba
42858 2026-03-20 02:34:12.753583 10.10.1.3 10.10.1.50 TCP 66 976 → 2049 [ACK] Seq=14332461 Ack=1382561 Win=26688 Len=0 TSval=2749783070 TSecr=3786939377
42859 2026-03-20 02:34:12.753635 10.10.1.3 10.10.1.50 NFS 330 V4 Call (Reply In 42860) SETATTR FH: 0xac0cc5de
42860 2026-03-20 02:34:12.753718 10.10.1.50 10.10.1.3 NFS 114 V4 Reply (Call In 42859) SEQUENCE Status: NFS4ERR_BADSESSION
42861 2026-03-20 02:34:12.753980 10.10.1.3 10.10.1.50 NFS 186 V4 Call (Reply In 42862) DESTROY_SESSION
42862 2026-03-20 02:34:12.754047 10.10.1.50 10.10.1.3 NFS 114 V4 Reply (Call In 42861) DESTROY_SESSION Status: NFS4ERR_BADSESSION
42863 2026-03-20 02:34:12.754111 10.10.1.3 10.10.1.50 NFS 298 V4 Call (Reply In 42864) CREATE_SESSION
42864 2026-03-20 02:34:12.754171 10.10.1.50 10.10.1.3 NFS 114 V4 Reply (Call In 42863) CREATE_SESSION Status: NFS4ERR_SEQ_MISORDERED
42865 2026-03-20 02:34:12.755288 10.10.1.50 10.10.1.8 NFS 246 V4 Reply (Call In 42852) EXCHANGE_ID
42866 2026-03-20 02:34:12.755357 10.10.1.8 10.10.1.50 NFS 298 V4 Call (Reply In 42867) CREATE_SESSION
42867 2026-03-20 02:34:12.755544 10.10.1.50 10.10.1.8 NFS 194 V4 Reply (Call In 42866) CREATE_SESSION
42868 2026-03-20 02:34:12.755606 10.10.1.8 10.10.1.50 NFS 218 V4 Call (Reply In 42869) PUTROOTFH | GETATTR
42869 2026-03-20 02:34:12.755706 10.10.1.50 10.10.1.8 NFS 182 V4 Reply (Call In 42868) PUTROOTFH | GETATTR
42870 2026-03-20 02:34:12.755775 10.10.1.8 10.10.1.50 NFS 210 V4 Call (Reply In 42871) RECLAIM_COMPLETE
42871 2026-03-20 02:34:12.755855 10.10.1.50 10.10.1.8 NFS 158 V4 Reply (Call In 42870) RECLAIM_COMPLETE
42872 2026-03-20 02:34:12.755926 10.10.1.8 10.10.1.50 NFS 290 V4 Call (Reply In 42873) GETATTR FH: 0xc7011572
42873 2026-03-20 02:34:12.756013 10.10.1.50 10.10.1.8 NFS 362 V4 Reply (Call In 42872) GETATTR
42874 2026-03-20 02:34:12.757262 10.10.1.8 10.10.1.50 NFS 290 V4 Call (Reply In 42875) GETATTR FH: 0x3bc92b95
42875 2026-03-20 02:34:12.757347 10.10.1.50 10.10.1.8 NFS 362 V4 Reply (Call In 42874) GETATTR
42876 2026-03-20 02:34:12.795850 10.10.1.3 10.10.1.50 TCP 66 976 → 2049 [ACK] Seq=14333077 Ack=1382705 Win=26688 Len=0 TSval=2749783113 TSecr=3786939378
42877 2026-03-20 02:34:12.799280 10.10.1.8 10.10.1.50 TCP 66 988 → 2049 [ACK] Seq=78001 Ack=49629 Win=1188 Len=0 TSval=2328275863 TSecr=986324573
43224 2026-03-20 02:34:13.779818 10.10.1.3 10.10.1.50 NFS 354 V4 Call (Reply In 43232) EXCHANGE_ID
43232 2026-03-20 02:34:13.782406 10.10.1.50 10.10.1.3 NFS 246 V4 Reply (Call In 43224) EXCHANGE_ID
Causa
Si dos o más clientes (comunes en VM clonadas o entornos en contenedores) comparten el mismo nombre de host:
- El host A establece una sesión.
- El host B se conecta con el mismo nombre de host; el servidor supone que el host A se reinició o se volvió a conectar.
- El servidor "caduca" la sesión del host A para permitir que el host B se conecte.
- A continuación, el host A intenta recuperar su sesión, lo que inicia al host B.
Esto da como resultado un ciclo continuo de restablecimientos de sesión y repeticiones de ID de secuencia. Esto conduce a una degradación grave del rendimiento, ya que el cliente debe pausar todas las operaciones de I/O durante un período de recuperación obligatorio (por lo general, 1 segundo) antes de volver a iniciar un EXCHANGE_ID para recuperar su sesión.
Resolución
El sistema Unity funciona según lo previsto y cumple con los estándares NFSv4.1/4.2 RFC. El servidor finaliza correctamente las sesiones cuando se presenta un ID de cliente duplicado (cadena de propietario) para evitar daños en los datos.
Para resolver la colisión, cada cliente debe tener un identificador único global. Asegúrese de que el nombre de host sea único en cada cliente que accede al recurso compartido:
hostnamectl set-hostname <unique_hostname>
Reinicie el servicio NFS o el cliente a fin de asegurarse de que el nuevo identificador se utilice para la próxima llamada de EXCHANGE_ID al servidor Unity.