Isilon:OneFS:ウォッチドッグ エラーを解釈する方法
Summary: ソフトウェア ウォッチドッグは、カーネルを監視し、スタックを出力したり、ノードが応答しなくなったときにノードを再起動したりするプロセスです。これにより、重大なCPU不足の症状からクラスターが保護され、Dellテクニカル サポートが問題を特定して修正するのに役立ちます。
This article applies to
This article does not apply to
This article is not tied to any specific product.
Not all product versions are identified in this article.
Instructions
概要
このナレッジベース記事では、swatchdogプロセスによって作成されたスタックを読み取って解釈する方法について説明します。ソフトウェアウォッチドッグは、スウォッチドッグまたはソフトウォッチとも呼ばれます。
詳細
ノードが スタックを/var/log/messages ファイルに書き込んだり、次のようなエラーでノード自体を再起動したりすることがあります。
********************************************** Software Watchdog failed (userspace is starved!) ********************************************** ********************************************** Software Watchdog failed on CPU 0 (6353: kt: gmp-split [-]) 0x80bda7b9 -> 0x80bda5dc (fp=0xf734bb78): lk_fail_create_entry_and_owner 0x80bbe950 -> 0x80bbe7e0 (fp=0xf734bbf0): lkf_group_change_save_locks 0x80aa251c -> 0x80aa2268 (fp=0xf734bc2c): rtxn_sync_locks_prepare 0x80aa447d -> 0x80aa4304 (fp=0xf734bcdc): rtxn_split 0x80aac9cf -> 0x80aac8ec (fp=0xf734bcfc): kt_main 0x802a9d43 -> 0x802a9ca8 (fp=0xf734bd14): fork_exit intr counts: irq3: 1382 irq4: 1164845 irq14: 19331 irq17: 10672321 irq18: 11 stray: 1 irq24: 22011026 irq48: 46902637 ********************************************** panic @ time 1257444527.664: Software watchdog timed out Stack: ------------------------------------------------- 0x802e24f0 -> 0x802e24e4 (fp=0xf734ba78): isi_swatchdog_panic 0x802e27d7 -> 0x802e26ac (fp=0xf734ba8c): isi_swatchdog_hardclock 0x80295187 -> 0x80295068 (fp=0xf734bab0): hardclock_process 0x802951ba -> 0x802951a8 (fp=0xf734bac4): hardclock 0x8041d608 -> 0x8041d5b8 (fp=0xf734bad4): lapic_handle_timer 0x804281c3 -> 0x804281a4 (fp=0xf734bb78): bcmp 0x80bbe950 -> 0x80bbe7e0 (fp=0xf734bbf0): lkf_group_change_save_locks 0x80aa251c -> 0x80aa2268 (fp=0xf734bc2c): rtxn_sync_locks_prepare 0x80aa447d -> 0x80aa4304 (fp=0xf734bcdc): rtxn_split 0x80aac9cf -> 0x80aac8ec (fp=0xf734bcfc): kt_main 0x802a9d43 -> 0x802a9ca8 (fp=0xf734bd14): fork_exit ---------------------------------------------------------
スウォッチドッグは次のように構築されます。
- ローレベルタイマ割り込みは10秒ごとにトリガされます。
- 高レベルのユーザー空間コードは、5 秒ごとにタイマー割り込みのメールボックスの設定を試みます。
低レベル・タイマー割り込みがユーザー・スペースからのメールボックス・ノートの検出に失敗した場合にアクションが実行され、スタックがダンプされます。4回連続して失敗すると、クラスターが再起動されます。
エラー スタックまたはswatchdogによってトリガーされる再起動の解釈については、 Dellテクニカル サポートにお問い合わせください。
Affected Products
IsilonProducts
Isilon, PowerScale OneFSArticle Properties
Article Number: 000018976
Article Type: How To
Last Modified: 10 Jun 2025
Version: 6
Find answers to your questions from other Dell users
Support Services
Check if your device is covered by Support Services.