PowerScale : Isilon : le nœud panique génère l’erreur « Fatal trap 12 : page fault while in kernel mode » OU l’assertion a échoué
Summary: Le nœud Isilon/PowerScale présente un fonctionnement inattendu avec la pile suivante : panic @ time 1636820409.559, thread 0xfffff80b615e8000 : Interruption fatale 12 : erreur de page en mode noyau Dans la pile, vous voyez : noyau :lki_shrink_lazy_queue+0x439 noyau :lin_lock_deltaread_lock_loss_probe+0x120 ...
Symptoms
Le nœud Isilon/PowerScale présente un fonctionnement inattendu avec la pile suivante :
panic @ time 1636820409.559, thread 0xfffff80b615e8000: Fatal trap 12: page fault while in kernel mode time = 1636820409 cpuid = 3, TSC = 0x1825289de5b108 Panic occurred in module kernel loaded at 0xffffffff80200000: Stack: -------------------------------------------------- kernel:trap_fatal+0xa3 kernel:trap_pfault+0x48 kernel:trap+0x314 kernel:curb_cache_free_nondelta+0x43 kernel:bam_update_inode_lock_loss_cb+0x161 kernel:lin_lock_deltaread_lock_loss_probe+0x120 kernel:lki_decide_llcb_type_and_probe+0x26c kernel:lki_lock_loss_add_waiters+0x4b kernel:lki_unlock_idds_entry+0x258 kernel:lki_shrink_lazy_queue+0x439 kernel:_lki_unlock_owner+0x413 kernel:lki_unlock_impl+0x56b kernel:lk_unlock+0xbf kernel:lin_lock_release_locker+0x28 kernel:ifs_vnop_wrapunlock+0xfe kernel:VOP_UNLOCK_APV+0x97 kernel:vputx+0x154 kernel:bam_vput+0x20 kernel:putfd+0x17 kernel:_pctl2_start_restripe+0x35a kernel:_sys_pctl2_start_restripe+0x58a kernel:amd
OU
panic @ time 1640560360.736, thread 0xfffff805f25cd000: Assertion Failure time = 1640560360 cpuid = 5, TSC = 0x5afba0fd75a32d Panic occurred in module kernel loaded at 0xffffffff80200000: Stack: -------------------------------------------------- kernel:isi_assert_halt+0x2e kernel:curb_cache_lin_llcb+0x56 kernel:bam_update_inode_lock_loss_cb+0x161 kernel:lin_lock_deltaread_lock_loss_probe+0x120 kernel:lki_decide_llcb_type_and_probe+0x26c kernel:lki_lock_loss_add_waiters+0x4b kernel:lki_unlock_idds_entry+0x258 kernel:lki_shrink_lazy_queue+0x439 kernel:_lki_unlock_owner+0x413 kernel:lki_unlock_impl+0x56b kernel:lk_unlock+0xbf kernel:lin_lock_release_locker+0x28 kernel:ifs_vnop_wrapunlock+0xfe kernel:VOP_UNLOCK_APV+0x97 kernel:vputx+0x154 kernel:bam_vput+0x20 kernel:putfd+0x17 kernel:_sys_ifs_sbt_get_entry+0x315 kernel:amd64_syscall+0x9f2
Cause
Causé par un problème connu PSCALE-62304, résolu dans la version 9.1.0.13 (correctif de novembre) et également dans la version 9.2.0.0
(résolu dans le correctif 9.1.0.13 : [9.1.0.13_GA-RUP_2021-11][Plusieurs correctifs d’espace utilisateur et de noyau](novembre 2021)
Le redémarrage inattendu est provoqué par une condition de concurrence lors de la libération d’un cache à partir d’un inode de statistiques de cluster à usage interne.
Ce problème dans le code a été corrigé dans les versions suivantes ou ultérieures :
- OneFS 9.1.0.13 via PSCALE-62304
- OneFS 9.2 via PSCALE-49586
- OneFS 9.3 via PSCALE-50848
Resolution
Conseillez au client d’effectuer une mise à niveau vers l’une des versions ci-dessus.
Aucune solution de contournement n’est disponible.