PowerScale: błąd węzłów: Jądro błędu asercji:pdm_entries_get_cacheable_entry+0x48e
Résumé: Wiele węzłów PowerScale panikuje ze stosem: Błąd asercji jądro:pdm_entries_get_cacheable_entry+0x48e, jądro:pdm_member_generate_entry+0xda
Symptômes
Wiele węzłów PowerScale panikuje ze stosem:
ipfw2 (+ipv6) initialized, divert loadable, nat loadable, default to accept, logging disabled mce2: Interface stopped DISTRIBUTING, possible flapping panic @ time 1642530761.327, thread 0xfffffea7a8a76580: Assertion Failure time = 1642530761 cpuid = 24, TSC = 0xe457b789d574ac Panic occurred in module kernel loaded at 0xffffffff80200000: Stack: -------------------------------------------------- kernel:isi_assert_halt+0x2e kernel:pdm_entries_get_cacheable_entry+0x48e kernel:pdm_entries_get+0x95 kernel:pdm_entries_get_global+0x33 kernel:pdm_get_painted_domids+0x2e2 kernel:pdm_member_generate_entry+0xda kernel:pdm_member_get_membership_entry+0x1b7 kernel:pdm_member_init_operation+0x16d kernel:ifm_init_operation+0xb7 kernel:txn_i_include_vnode_to_list+0xc0 kernel:pdm_vget_adsio_txn_include+0x12c kernel:pdm_domain_paint_adsdir+0x41 kernel:pdm_unlink+0x1f0 kernel:bam_rename+0x2bcb kernel:ifs_vnop_wraprename+0x96 kernel:VOP_RENAME_APV+0x9b isi_lwext.ko:lwextsvc_rename+0xe35 kernel:amd64_syscall+0x380 -------------------------------------------------- *** FAILED ASSERTION !pdm_lk_is_held(domid, PDM_EXCLUSIVE) @ /b/mnt/src/sys/ifs/pdm/pdm_ops.c:443: Disabling swatchdog Dumping stacks (40960 bytes)
Cause
Spowodowane następującą wadą: PSCALE-63084: FAILED ASSERTION !pdm_lk_is_held(domid, PDM_EXCLUSIVE) @ /b/mnt/src/sys/ifs/pdm/pdm_ops.c:443 During ADS rename
Ten problem jest związany z przepływem pracy ADS (alternatywne strumienie danych). Alternatywne strumienie danych to struktura danych używana w systemie Windows, która przechowuje typy metadanych informacji o pliku, takie jak komentarze dotyczące pliku. Nie istnieje on we FreeBSD (który jest podstawowym systemem plików OneFS w Isilon), ale OneFS go obsługuje i jest traktowany jako plik w OneFS.
Sytuacja wyścigu występuje, gdy OneFS zmienia nazwę pliku ADS poza granicą domeny (w migawce lub poza nią) w celu zastąpienia dołączonego na stałe pliku ADS. Powoduje to, że węzeł przestaje odpowiadać przy próbie wykonania operacji. W rezultacie może wystąpić niedostępność danych (DU).
Jak ustalić, czy klaster jest zagrożony tym problemem?
W klastrze działa kod OneFS starszy niż 9.3.0.0.
Jeśli przepływ pracy nie korzysta z ADS i operacji zmiany nazwy, OneFS nie napotka tego problemu.
Résolution
Uaktualnij OneFS do wersji 9.3.0.0 lub nowszej.
Obejście:
W razie potrzeby dział pomocy technicznej PowerScale może przeanalizować minizrzut zebrany z węzła, który uległ awarii, aby określić, jaki plik/folder był powiązany z awarią.