Isilon: OneFS-Güvenlik izleyici köpekleri hatalarını yorumlama

Summary: Yazılım izleyicisi, çekirdeği izleyen ve düğüm yanıt vermediğinde bir yığın yazdıran veya düğümü yeniden başlatan bir işlemdir. Bu, kümeyi büyük CPU yetersizliği belirtilerinden korur ve Dell Teknik Destek ekibinin sorunları tespit edip düzeltmesine yardımcı olur. ...

This article applies to This article does not apply to This article is not tied to any specific product. Not all product versions are identified in this article.

Instructions

Giriş

Bu Knowledge makalesinde, swatchdog işlemi tarafından oluşturulan bir yığının nasıl okunacağı ve yorumlanacağı açıklanmaktadır. Yazılım bekçisi, swatchdog veya softwatch olarak da bilinir.

 

Ayrıntılar

Bazen bir düğüm /var/log/messages dosyasına bir yığın yazar veya aşağıdakine benzer bir hatayla kendini yeniden başlatır:

**********************************************
Software Watchdog failed (userspace is starved!)
**********************************************

**********************************************
Software Watchdog failed on CPU 0 (6353: kt: gmp-split [-])
0x80bda7b9 -> 0x80bda5dc (fp=0xf734bb78): lk_fail_create_entry_and_owner
0x80bbe950 -> 0x80bbe7e0 (fp=0xf734bbf0): lkf_group_change_save_locks
0x80aa251c -> 0x80aa2268 (fp=0xf734bc2c): rtxn_sync_locks_prepare
0x80aa447d -> 0x80aa4304 (fp=0xf734bcdc): rtxn_split
0x80aac9cf -> 0x80aac8ec (fp=0xf734bcfc): kt_main
0x802a9d43 -> 0x802a9ca8 (fp=0xf734bd14): fork_exit

intr counts:
irq3: 1382 irq4: 1164845 irq14: 19331 irq17: 10672321 irq18: 11 stray: 1 irq24: 22011026 irq48: 46902637
**********************************************

panic @ time 1257444527.664: Software watchdog timed out

Stack: -------------------------------------------------

0x802e24f0 -> 0x802e24e4 (fp=0xf734ba78): isi_swatchdog_panic
0x802e27d7 -> 0x802e26ac (fp=0xf734ba8c): isi_swatchdog_hardclock
0x80295187 -> 0x80295068 (fp=0xf734bab0): hardclock_process
0x802951ba -> 0x802951a8 (fp=0xf734bac4): hardclock
0x8041d608 -> 0x8041d5b8 (fp=0xf734bad4): lapic_handle_timer
0x804281c3 -> 0x804281a4 (fp=0xf734bb78): bcmp
0x80bbe950 -> 0x80bbe7e0 (fp=0xf734bbf0): lkf_group_change_save_locks
0x80aa251c -> 0x80aa2268 (fp=0xf734bc2c): rtxn_sync_locks_prepare
0x80aa447d -> 0x80aa4304 (fp=0xf734bcdc): rtxn_split
0x80aac9cf -> 0x80aac8ec (fp=0xf734bcfc): kt_main
0x802a9d43 -> 0x802a9ca8 (fp=0xf734bd14): fork_exit

---------------------------------------------------------

Gözetleme köpeği şu şekilde oluşturulur:

  • Her 10 saniyede bir düşük seviyeli zamanlayıcı kesintisi tetiklenir.
  • Üst düzey kullanıcı alanı kodu, her 5 saniyede bir zamanlayıcı kesintisi için bir posta kutusu ayarlamaya çalışır.

Düşük düzeyli zamanlayıcı kesmesi, kullanıcı alanından bir posta kutusu notu bulamadığında işlem yapılır, ardından yığın dökülür. Arka arkaya dört hatadan sonra küme yeniden başlatılır.
Yeniden başlatmayla tetiklenen bir hata yığınını veya gözlemciyi yorumlama konusunda yardım almak için Dell Teknik Destek ile iletişime geçin.

Affected Products

Isilon

Products

Isilon, PowerScale OneFS
Article Properties
Article Number: 000018976
Article Type: How To
Last Modified: 10 Jun 2025
Version:  6
Find answers to your questions from other Dell users
Support Services
Check if your device is covered by Support Services.