「Data Domain:BoostFSでパニックが発生するか、マウント ポイントが応答しなくなる

Zusammenfassung: バックアップ アプリケーションがBoostFSマウント ポイントでI/O操作を実行すると、BoostFSがパニックまたはクラッシュするか、マウント ポイントが応答しなくなります。

Dieser Artikel gilt für Dieser Artikel gilt nicht für Dieser Artikel ist nicht an ein bestimmtes Produkt gebunden. In diesem Artikel werden nicht alle Produktversionen aufgeführt.

Symptome

現象:

  • BoostFSがランダムにクラッシュしてパニックが発生します。これは、ワークロードが高い場合に発生します。
  • バックアップ アプリケーションは、遅延した READWRITE BoostFSマウント ポイントに対する操作。
  • に遅延がある場合 READWRITE バックアップ アプリケーションからの操作では、BoostFSログにこれが表示されます error 5057 File handle is stale from Data Domain serverの詳細を確認してください。

BoostFSログ:

###### WRITE operation FAILED due to STALE FILE HANDLE error ######
Sep 11 00:36:29.635 7884 10740 [E] [ddp log] [1ECC:29F4] ddcl_ddcp_send_file_loop: Call to recv
refs2 failed. [ERR=5057] Sep 11 00:36:29.635 7884 10740 [E] [ddp log] [1ECC:29F4] ddcl_ddcp_pwrite: Call to send file loop2 failed. [ERR=5057]
Sep 11 00:36:29.635 7884 10740 [E] [ddp log] [1ECC:29F4] ddcl_ddcp_pwrite: Error in ddcl ddcp
pwrite. [ERR=5057] Sep 11 00:36:29.635 7884 10740 [E] [ddp log] [1ECC:29F4] ddp_write() failed Offset 11010048, BytesToWrite 1048576, BytesWritten 0 Err: 5057-File handle is stale
Sep 11 00:36:29.635 7884 10740 [E] bfs_cache_flush: failed: 5057 File handle is stale (0 bytes written)
Sep 11 00:36:29.651 7884 11292 [E] [ddp log] [1ECC:2C1C] ddcl_ddcp_send_file_loop: Call to recv
refs2 failed. [ERR=5057]
####### PANIC occurred HERE #######
Sep 11 00:36:29.667 7884 11292 [E] [ddp log] [1ECC:2C1C] PANIC: ..\ddcl\ddcl_ddcp.c:
ddcl_ddcp_commit: 4541: !(c->send_offset == c->write_offset)

トリアージ:

  1. BoostFSとサーバー側のDDFSログで、前述のエラーを確認します。
  2. 次の遅延を確認します。 READWRITE バックアップ アプリケーションからの操作。BoostFS APIのエントリー ログと終了ログを検討してください。
  3. に設定された値を確認します OST_ABANDON_TIMEOUT (デフォルトは3時間)。
  4. RPCのタイムアウトが、 OST_ABANDON_TIMEOUTの詳細を確認してください。

Ursache

  1. この問題は、次の READWRITE バックアップ アプリケーションによる操作。これにより、DDFSがタイムアウトを破棄するようにトリガーされます。これにより、対応するファイル ハンドルが3時間後に閉じられます(デフォルト値)
  2. これは、DDFSが非アクティブなファイル ハンドルを識別するために使用するデフォルトの破棄タイムアウト期間です。最終的に、新しい書き込みでクライアント側でパニックが発生する可能性があります。

Lösung

Dellサポートに連絡して、bash.

へのアクセスを必要とするタイムアウトを増やしてください。[Change]を OST_ABANDON_TIMEOUT パラメーターをサーバー側で設定します。この値は、最大12時間でより大きな値に設定できます。

 

注:ソリューションの適用の一環として、ファイル システムを無効化および有効化する必要があります。

 

  1. adminロールのアクセス権でData Domainにログインします。サポートがbashモードに切り替わってから、 se mode を ddsh -s
  2. オリジナルをチェック OST_ABANDON_TIMEOUT 値。
SE@dd## se sysparam show OST_ABANDON_TIMEOUT
  1. [ OST_ABANDON_TIMEOUT 値。既定では、値は 10800 (3 時間) です。
SE@dd## se sysparam set OST_ABANDON_TIMEOUT=129600
SE@dd## se sysparam show OST_ABANDON_TIMEOUT

Name Description Current Default Override
------------------- --------------------------------- ------- ------- -----
---
OST_ABANDON_TIMEOUT DDCP abandon context timeout(sec) 129600 10800 rpc
------------------- --------------------------------- ------- ------- -----
---

SE@dd##priv set admin
  1. 前述のパラメーターを変更した後、ファイル システムを再起動します。この再起動が許可されているかどうかをお客様に確認します。そうでない場合は、次のコマンドを実行するメンテナンス期間をスケジュールします。
SE@dd## filesys disable
SE@dd## filesys enable

Betroffene Produkte

Data Domain
Artikeleigenschaften
Artikelnummer: 000215706
Artikeltyp: Solution
Zuletzt geändert: 14 Jän. 2026
Version:  4
Antworten auf Ihre Fragen erhalten Sie von anderen Dell NutzerInnen
Support Services
Prüfen Sie, ob Ihr Gerät durch Support Services abgedeckt ist.