Data Domain:BoostFS 錯誤或掛接點無回應

Zusammenfassung: 當備份應用程式在 BoostFS 固定點上執行 I/O 作業時,BoostFS 會發生錯誤或當機,或掛接點沒有回應。

Dieser Artikel gilt für Dieser Artikel gilt nicht für Dieser Artikel ist nicht an ein bestimmtes Produkt gebunden. In diesem Artikel werden nicht alle Produktversionen aufgeführt.

Symptome

症狀:

  • BoostFS 會隨機當機和緊急情況。當工作負載高時,會發生這種情況。
  • 備份應用程式執行延遲 READWRITE BoostFS 掛載點上的作業。
  • READWRITE 備份應用程式的作業,BoostFS 記錄會顯示以下內容 error 5057 File handle is stale from Data Domain server

BoostFS 記錄:

###### WRITE operation FAILED due to STALE FILE HANDLE error ######
Sep 11 00:36:29.635 7884 10740 [E] [ddp log] [1ECC:29F4] ddcl_ddcp_send_file_loop: Call to recv
refs2 failed. [ERR=5057] Sep 11 00:36:29.635 7884 10740 [E] [ddp log] [1ECC:29F4] ddcl_ddcp_pwrite: Call to send file loop2 failed. [ERR=5057]
Sep 11 00:36:29.635 7884 10740 [E] [ddp log] [1ECC:29F4] ddcl_ddcp_pwrite: Error in ddcl ddcp
pwrite. [ERR=5057] Sep 11 00:36:29.635 7884 10740 [E] [ddp log] [1ECC:29F4] ddp_write() failed Offset 11010048, BytesToWrite 1048576, BytesWritten 0 Err: 5057-File handle is stale
Sep 11 00:36:29.635 7884 10740 [E] bfs_cache_flush: failed: 5057 File handle is stale (0 bytes written)
Sep 11 00:36:29.651 7884 11292 [E] [ddp log] [1ECC:2C1C] ddcl_ddcp_send_file_loop: Call to recv
refs2 failed. [ERR=5057]
####### PANIC occurred HERE #######
Sep 11 00:36:29.667 7884 11292 [E] [ddp log] [1ECC:2C1C] PANIC: ..\ddcl\ddcl_ddcp.c:
ddcl_ddcp_commit: 4541: !(c->send_offset == c->write_offset)

分級:

  1. 檢查 BoostFS 和伺服器端 DDFS 記錄,以瞭解上述錯誤。
  2. 觀察延遲 READWRITE 備份應用程式的操作。請考慮 BoostFS API 的進入與結束記錄。
  3. 檢查設定的值 OST_ABANDON_TIMEOUT (預設為三小時)。
  4. 檢查 RPC 的逾時是否大於為 OST_ABANDON_TIMEOUT

Ursache

  1. 此問題是由於 READWRITE 備份應用程式的操作。這會觸發 DDFS 捨棄逾時。這會導致在三小時後關閉相應的檔句柄(預設值)
  2. 這是 DDFS 用來識別非使用中檔案控制碼的預設放棄逾時期間。最終,新的寫入可能會在用戶端遇到錯誤。

Lösung

請聯絡 Dell 支援 以增加需要存取 bash 的逾時。

變更 OST_ABANDON_TIMEOUT 使用以下步驟在伺服器端設置參數。其值可以設置為最大 12 小時的較大值。

 

注意:在套用解決方案時,必須先停用和啟用檔案系統。

 

  1. 使用管理員角色存取權限登入 Data Domain。支援進入 bash 模式,然後進入 se 模式與 ddsh -s
  2. 檢查 原件 OST_ABANDON_TIMEOUT 值。
SE@dd## se sysparam show OST_ABANDON_TIMEOUT
  1. 增加 OST_ABANDON_TIMEOUT 值。默認情況下,該值為 10800(三小時)。
SE@dd## se sysparam set OST_ABANDON_TIMEOUT=129600
SE@dd## se sysparam show OST_ABANDON_TIMEOUT

Name Description Current Default Override
------------------- --------------------------------- ------- ------- -----
---
OST_ABANDON_TIMEOUT DDCP abandon context timeout(sec) 129600 10800 rpc
------------------- --------------------------------- ------- ------- -----
---

SE@dd##priv set admin
  1. 在上述參數變更後重新啟動檔案系統。請與客戶確認是否允許重新開機。如果沒有,請安排維護時段以執行以下命令:
SE@dd## filesys disable
SE@dd## filesys enable

Betroffene Produkte

Data Domain
Artikeleigenschaften
Artikelnummer: 000215706
Artikeltyp: Solution
Zuletzt geändert: 14 Jan. 2026
Version:  4
Antworten auf Ihre Fragen erhalten Sie von anderen Dell NutzerInnen
Support Services
Prüfen Sie, ob Ihr Gerät durch Support Services abgedeckt ist.