Data Domain: BoostFS entra en estado de alarma o el punto de montaje deja de responder

Zusammenfassung: BoostFS entra en estado de alarma o se bloquea, o el punto de montaje deja de responder cuando la aplicación de respaldo realiza operaciones de I/O en el punto de montaje de BoostFS.

Dieser Artikel gilt für Dieser Artikel gilt nicht für Dieser Artikel ist nicht an ein bestimmtes Produkt gebunden. In diesem Artikel werden nicht alle Produktversionen aufgeführt.

Symptome

Indicios:

  • BoostFS se bloquea y entra en estado de alarma aleatoriamente. Esto sucede cuando la carga de trabajo es alta.
  • La aplicación de respaldo se retrasa READ y WRITE en el punto de montaje de BoostFS.
  • Cuando hay retrasos en READ y WRITE operaciones desde la aplicación de respaldo, los registros de BoostFS muestran lo siguiente error 5057 File handle is stale from Data Domain server.

Registros de BoostFS:

###### WRITE operation FAILED due to STALE FILE HANDLE error ######
Sep 11 00:36:29.635 7884 10740 [E] [ddp log] [1ECC:29F4] ddcl_ddcp_send_file_loop: Call to recv
refs2 failed. [ERR=5057] Sep 11 00:36:29.635 7884 10740 [E] [ddp log] [1ECC:29F4] ddcl_ddcp_pwrite: Call to send file loop2 failed. [ERR=5057]
Sep 11 00:36:29.635 7884 10740 [E] [ddp log] [1ECC:29F4] ddcl_ddcp_pwrite: Error in ddcl ddcp
pwrite. [ERR=5057] Sep 11 00:36:29.635 7884 10740 [E] [ddp log] [1ECC:29F4] ddp_write() failed Offset 11010048, BytesToWrite 1048576, BytesWritten 0 Err: 5057-File handle is stale
Sep 11 00:36:29.635 7884 10740 [E] bfs_cache_flush: failed: 5057 File handle is stale (0 bytes written)
Sep 11 00:36:29.651 7884 11292 [E] [ddp log] [1ECC:2C1C] ddcl_ddcp_send_file_loop: Call to recv
refs2 failed. [ERR=5057]
####### PANIC occurred HERE #######
Sep 11 00:36:29.667 7884 11292 [E] [ddp log] [1ECC:2C1C] PANIC: ..\ddcl\ddcl_ddcp.c:
ddcl_ddcp_commit: 4541: !(c->send_offset == c->write_offset)

Triaje:

  1. Compruebe los registros de BoostFS y DDFS del lado del servidor en busca del error informado anteriormente.
  2. Observe el retraso en READ y WRITE operaciones de la aplicación de respaldo. Tenga en cuenta los registros de entrada y salida de la API de BoostFS.
  3. Compruebe el valor configurado para OST_ABANDON_TIMEOUT (el valor predeterminado es de tres horas).
  4. Compruebe que el tiempo de espera agotado de la RPC sea mayor que el valor configurado para OST_ABANDON_TIMEOUT.

Ursache

  1. El problema se debe a un retraso en la READ y WRITE operaciones de la aplicación de respaldo. Esto activa DDFS para descartar el tiempo de espera. Esto lleva al cierre del identificador de archivo correspondiente después de tres horas (valor predeterminado)
  2. Este es el período de tiempo de espera de descarte predeterminado que utiliza DDFS para identificar el identificador de archivo inactivo. Eventualmente, las escrituras nuevas pueden experimentar un estado de alarma en el lado del cliente.

Lösung

Póngase en contacto con el soporte de Dell para aumentar el tiempo de espera que requiere acceso a bash.

Cambie la opción OST_ABANDON_TIMEOUT en el lado del servidor siguiendo los pasos que se indican a continuación. Su valor se puede configurar en un valor mayor con un máximo de 12 horas.

 

Nota: El sistema de archivos debe estar deshabilitado y habilitado como parte de la aplicación de la solución.

 

  1. Inicie sesión en Data Domain con acceso de función de administrador . El soporte ingresa al modo bash y, a continuación, ingresa se Modo con ddsh -s
  2. Comprobar el original OST_ABANDON_TIMEOUT valor.
SE@dd## se sysparam show OST_ABANDON_TIMEOUT
  1. Aumente el OST_ABANDON_TIMEOUT valor. De manera predeterminada, el valor es 10 800 (tres horas).
SE@dd## se sysparam set OST_ABANDON_TIMEOUT=129600
SE@dd## se sysparam show OST_ABANDON_TIMEOUT

Name Description Current Default Override
------------------- --------------------------------- ------- ------- -----
---
OST_ABANDON_TIMEOUT DDCP abandon context timeout(sec) 129600 10800 rpc
------------------- --------------------------------- ------- ------- -----
---

SE@dd##priv set admin
  1. Reinicie el sistema de archivos después del cambio del parámetro anterior. Confirme con el cliente si se permite este reinicio. Si no es así, programe un período de mantenimiento para ejecutar el siguiente comando:
SE@dd## filesys disable
SE@dd## filesys enable

Betroffene Produkte

Data Domain
Artikeleigenschaften
Artikelnummer: 000215706
Artikeltyp: Solution
Zuletzt geändert: 14 Jän. 2026
Version:  4
Antworten auf Ihre Fragen erhalten Sie von anderen Dell NutzerInnen
Support Services
Prüfen Sie, ob Ihr Gerät durch Support Services abgedeckt ist.