PowerScale: panika uzlů: Selhání kontrolního výrazu jádro:pdm_entries_get_cacheable_entry+0x48e
Résumé: U několika uzlů PowerScale dojde k panice se zásobníkem: Selhání assertion kernel:pdm_entries_get_cacheable_entry+0x48e, kernel:pdm_member_generate_entry+0xda
Symptômes
U několika uzlů PowerScale dojde k panice se zásobníkem:
ipfw2 (+ipv6) initialized, divert loadable, nat loadable, default to accept, logging disabled mce2: Interface stopped DISTRIBUTING, possible flapping panic @ time 1642530761.327, thread 0xfffffea7a8a76580: Assertion Failure time = 1642530761 cpuid = 24, TSC = 0xe457b789d574ac Panic occurred in module kernel loaded at 0xffffffff80200000: Stack: -------------------------------------------------- kernel:isi_assert_halt+0x2e kernel:pdm_entries_get_cacheable_entry+0x48e kernel:pdm_entries_get+0x95 kernel:pdm_entries_get_global+0x33 kernel:pdm_get_painted_domids+0x2e2 kernel:pdm_member_generate_entry+0xda kernel:pdm_member_get_membership_entry+0x1b7 kernel:pdm_member_init_operation+0x16d kernel:ifm_init_operation+0xb7 kernel:txn_i_include_vnode_to_list+0xc0 kernel:pdm_vget_adsio_txn_include+0x12c kernel:pdm_domain_paint_adsdir+0x41 kernel:pdm_unlink+0x1f0 kernel:bam_rename+0x2bcb kernel:ifs_vnop_wraprename+0x96 kernel:VOP_RENAME_APV+0x9b isi_lwext.ko:lwextsvc_rename+0xe35 kernel:amd64_syscall+0x380 -------------------------------------------------- *** FAILED ASSERTION !pdm_lk_is_held(domid, PDM_EXCLUSIVE) @ /b/mnt/src/sys/ifs/pdm/pdm_ops.c:443: Disabling swatchdog Dumping stacks (40960 bytes)
Cause
Způsobeno následující závadou: PSCALE-63084: FAILED ASSERTION !pdm_lk_is_held(domid, PDM_EXCLUSIVE) @ /b/mnt/src/sys/ifs/pdm/pdm_ops.c:443 During ADS rename
Tento problém souvisí s pracovním postupem ADS (alternativní datové proudy). Alternativní datové proudy jsou datovou strukturou používanou v systému Windows, která ukládá informace o souboru typu metadat, například komentáře k souboru. Neexistuje ve FreeBSD (což je základní souborový systém OneFS na Isilon), ale OneFS jej podporuje a je s ním zacházeno jako se souborem v rámci OneFS.
K konfliktu časování dochází, když systém OneFS přejmenuje soubor ADS přes hranici domény (ve snapshotu nebo mimo něj) za účelem přepsání pevně propojeného souboru ADS. To způsobí, že uzel přestane reagovat, když byl proveden pokus o operaci. V důsledku toho může dojít k nedostupnosti dat (DU).
Jak zjistit, zda je cluster ohrožen tímto problémem?
Cluster používá kód OneFS starší než 9.3.0.0.
Pokud pracovní postup nepoužívá operace ADS a "přejmenování", v systému OneFS k tomuto problému nedojde.
Résolution
Proveďte upgrade na systém OneFS verze 9.3.0.0 nebo vyšší.
Řešení:
V případě potřeby může podpora PowerScale prostudovat shromážděný minimální výpis z panického uzlu, což nám pomůže určit, který soubor nebo složka byly spojeny s panikou.