Data Domain:キャッシュ エレメント プールのメモリー不足時にinodeキャッシュでFSプロセス パニックが発生する
Résumé: ワークロードに応じてキャッシュ要素プールがメモリー不足になり、ワークロードに応じてinodeキャッシュ コードでFSプロセス パニックが発生する可能性がある最近のDDOSバージョン(7.7.4、7.9.0.10、7.10.0でも、DDOS 7.7.3に影響を与える場合は疑わしい)で欠陥が見つかりました。
Cet article concerne
Cet article ne concerne pas
Cet article n’est associé à aucun produit spécifique.
Toutes les versions du produit ne sont pas identifiées dans cet article.
Symptômes
この問題に対する劣化や事前警告はありません。この警告は、FSプロセス障害(PANIC)の形で現れます。その後、プロセスが再起動し、自動的に正常に再び起動します。
コード パスが実行されているため、次のようないくつかの方法でFSプロセスがパニック状態になる場合があります。
コード パスが実行されているため、次のようないくつかの方法でFSプロセスがパニック状態になる場合があります。
PANIC: ddr/sm/ddfs/ddfs_mtree.c: ddfs_mtree_list: 829: !((dd_errno(e) == ENOENT) || (dd_errno(e) == DD_ERR_FM_EATTRNOENT) || (dd_errno(e) == DD_ERR_STALE)) PANIC: ddr/fv/file_verify.c: file_verify_update_marker_attrs: 4872: Fatal Error PANIC: ddr/fv/file_verify.c: file_verify_update_snap_attr: 4446: Fatal Error PANIC: ddr/fv/file_verify.c: file_verify_update_marker_attrs: 4860: Fatal Error
FSプロセス ログ ファイル(ddfs。info)各プロセスがクラッシュする前に、次のメッセージが表示されます。
01/17 20:21:59.292947 [7fbbf4f98f50] dd_cache_elem_reclaim: Evict count=256, Visited count=257, Skipped elem count=0, Skipped bucket count=0, Time threshold=1539816333626910. (99% full) Complete=True 01/17 20:22:04.662303 [7fbb031ad4f0] ERROR: FM fm_iget:355 - fm_iget failed to allocate elem in dd_cache 5001
内部プロセスがいっぱいであることを示すメッセージが99%フルで、それ以上の要素を割り当てることができないため、プロセスクラッシュが発生しました。
メモ: この問題は、次のバージョンにのみ影響することが知られています。
- DDOS 7.7.3.x: 完全には確認されていません
- DDOS 7.7.4.x
- DDOS 7.9.0.10
- DDOS 7.10.0.x
Cause
読み取り/書き込みなどのファイル操作では、inode構造がdd_cacheエレメント プールから割り当てられます。
このキャッシュがいっぱいになり、新しいリクエストが入ってきた場合は、このキャッシュから要素がエビクトされ、新しいリクエストが処理されます。
このエビクションは、時間ポリシーに基づいています(最後の「x」秒でアクセスされていない場合、要素はエビクションされます)。
このキャッシュがホットになりすぎて(すべての要素が最後の「x」秒以内にアクセスされた)、複数回の再試行後でも要素をエビクトできない場合、fm_igetはDD_ERR_NOMEMを返します。
このエレメント プール割り当ての一部の呼び出し元はエラーを正常に処理できないため、FSプロセスがパニックになり、ダンプ コアが「fm_iget」機能すると、エラーが返されます。そのため、基盤となるコードの欠陥に対応するいくつかの異なるパニック シグネチャがあります。
このキャッシュがいっぱいになり、新しいリクエストが入ってきた場合は、このキャッシュから要素がエビクトされ、新しいリクエストが処理されます。
このエビクションは、時間ポリシーに基づいています(最後の「x」秒でアクセスされていない場合、要素はエビクションされます)。
このキャッシュがホットになりすぎて(すべての要素が最後の「x」秒以内にアクセスされた)、複数回の再試行後でも要素をエビクトできない場合、fm_igetはDD_ERR_NOMEMを返します。
このエレメント プール割り当ての一部の呼び出し元はエラーを正常に処理できないため、FSプロセスがパニックになり、ダンプ コアが「fm_iget」機能すると、エラーが返されます。そのため、基盤となるコードの欠陥に対応するいくつかの異なるパニック シグネチャがあります。
Résolution
これらのFSプロセスのクラッシュの原因となる基本的なコードの問題は、次のバージョン(および同じコード ブランチ内の以降のすべてのバージョン)でDDOS-168410 を使用して修正されています。
問題のあるバージョン(上記のリスト)を実行しているが、このKBの現象と一致する予期しないFSプロセスクラッシュが発生していない場合は、回避策をプロアクティブに適用しないことをお勧めします。代わりに、上記の修正済みリリース(またはその後継)のいずれかにアップグレードして、最新のアップデートとコード修正を利用してください。
- DDOS 7.7.5.1
- DDOS 7.10.1.0
- DDOS 7.11.0
問題のあるバージョン(上記のリスト)を実行しているが、このKBの現象と一致する予期しないFSプロセスクラッシュが発生していない場合は、回避策をプロアクティブに適用しないことをお勧めします。代わりに、上記の修正済みリリース(またはその後継)のいずれかにアップグレードして、最新のアップデートとコード修正を利用してください。
Produits concernés
Data DomainPropriétés de l’article
Numéro d’article: 000207919
Type d’article: Solution
Dernière modification: 21 déc. 2023
Version: 17
Trouvez des réponses à vos questions auprès d’autres utilisateurs Dell
Services de support
Vérifiez si votre appareil est couvert par les services de support.