Data Domain:キャッシュ エレメント プールのメモリー不足時にinodeキャッシュでFSプロセス パニックが発生する
Summary: ワークロードに応じてキャッシュ要素プールがメモリー不足になり、ワークロードに応じてinodeキャッシュ コードでFSプロセス パニックが発生する可能性がある最近のDDOSバージョン(7.7.4、7.9.0.10、7.10.0でも、DDOS 7.7.3に影響を与える場合は疑わしい)で欠陥が見つかりました。
This article applies to
This article does not apply to
This article is not tied to any specific product.
Not all product versions are identified in this article.
Symptoms
この問題に対する劣化や事前警告はありません。この警告は、FSプロセス障害(PANIC)の形で現れます。その後、プロセスが再起動し、自動的に正常に再び起動します。
コード パスが実行されているため、次のようないくつかの方法でFSプロセスがパニック状態になる場合があります。
コード パスが実行されているため、次のようないくつかの方法でFSプロセスがパニック状態になる場合があります。
PANIC: ddr/sm/ddfs/ddfs_mtree.c: ddfs_mtree_list: 829: !((dd_errno(e) == ENOENT) || (dd_errno(e) == DD_ERR_FM_EATTRNOENT) || (dd_errno(e) == DD_ERR_STALE)) PANIC: ddr/fv/file_verify.c: file_verify_update_marker_attrs: 4872: Fatal Error PANIC: ddr/fv/file_verify.c: file_verify_update_snap_attr: 4446: Fatal Error PANIC: ddr/fv/file_verify.c: file_verify_update_marker_attrs: 4860: Fatal Error
FSプロセス ログ ファイル(ddfs。info)各プロセスがクラッシュする前に、次のメッセージが表示されます。
01/17 20:21:59.292947 [7fbbf4f98f50] dd_cache_elem_reclaim: Evict count=256, Visited count=257, Skipped elem count=0, Skipped bucket count=0, Time threshold=1539816333626910. (99% full) Complete=True 01/17 20:22:04.662303 [7fbb031ad4f0] ERROR: FM fm_iget:355 - fm_iget failed to allocate elem in dd_cache 5001
内部プロセスがいっぱいであることを示すメッセージが99%フルで、それ以上の要素を割り当てることができないため、プロセスクラッシュが発生しました。
メモ: この問題は、次のバージョンにのみ影響することが知られています。
- DDOS 7.7.3.x: 完全には確認されていません
- DDOS 7.7.4.x
- DDOS 7.9.0.10
- DDOS 7.10.0.x
Cause
読み取り/書き込みなどのファイル操作では、inode構造がdd_cacheエレメント プールから割り当てられます。
このキャッシュがいっぱいになり、新しいリクエストが入ってきた場合は、このキャッシュから要素がエビクトされ、新しいリクエストが処理されます。
このエビクションは、時間ポリシーに基づいています(最後の「x」秒でアクセスされていない場合、要素はエビクションされます)。
このキャッシュがホットになりすぎて(すべての要素が最後の「x」秒以内にアクセスされた)、複数回の再試行後でも要素をエビクトできない場合、fm_igetはDD_ERR_NOMEMを返します。
このエレメント プール割り当ての一部の呼び出し元はエラーを正常に処理できないため、FSプロセスがパニックになり、ダンプ コアが「fm_iget」機能すると、エラーが返されます。そのため、基盤となるコードの欠陥に対応するいくつかの異なるパニック シグネチャがあります。
このキャッシュがいっぱいになり、新しいリクエストが入ってきた場合は、このキャッシュから要素がエビクトされ、新しいリクエストが処理されます。
このエビクションは、時間ポリシーに基づいています(最後の「x」秒でアクセスされていない場合、要素はエビクションされます)。
このキャッシュがホットになりすぎて(すべての要素が最後の「x」秒以内にアクセスされた)、複数回の再試行後でも要素をエビクトできない場合、fm_igetはDD_ERR_NOMEMを返します。
このエレメント プール割り当ての一部の呼び出し元はエラーを正常に処理できないため、FSプロセスがパニックになり、ダンプ コアが「fm_iget」機能すると、エラーが返されます。そのため、基盤となるコードの欠陥に対応するいくつかの異なるパニック シグネチャがあります。
Resolution
これらのFSプロセスのクラッシュの原因となる基本的なコードの問題は、次のバージョン(および同じコード ブランチ内の以降のすべてのバージョン)でDDOS-168410 を使用して修正されています。
問題のあるバージョン(上記のリスト)を実行しているが、このKBの現象と一致する予期しないFSプロセスクラッシュが発生していない場合は、回避策をプロアクティブに適用しないことをお勧めします。代わりに、上記の修正済みリリース(またはその後継)のいずれかにアップグレードして、最新のアップデートとコード修正を利用してください。
- DDOS 7.7.5.1
- DDOS 7.10.1.0
- DDOS 7.11.0
問題のあるバージョン(上記のリスト)を実行しているが、このKBの現象と一致する予期しないFSプロセスクラッシュが発生していない場合は、回避策をプロアクティブに適用しないことをお勧めします。代わりに、上記の修正済みリリース(またはその後継)のいずれかにアップグレードして、最新のアップデートとコード修正を利用してください。
Affected Products
Data DomainArticle Properties
Article Number: 000207919
Article Type: Solution
Last Modified: 21 Dec 2023
Version: 17
Find answers to your questions from other Dell users
Support Services
Check if your device is covered by Support Services.