PowerScale: noder panic: Kjerne for deklarasjonsfeil:pdm_entries_get_cacheable_entry+0x48e
Résumé: Flere PowerScale-noder får panikk med stabel: Kjerne for deklarasjonsfeil:pdm_entries_get_cacheable_entry+0x48e, kjerne:pdm_member_generate_entry+0xda
Symptômes
Flere PowerScale-noder får panikk med stabel:
ipfw2 (+ipv6) initialized, divert loadable, nat loadable, default to accept, logging disabled mce2: Interface stopped DISTRIBUTING, possible flapping panic @ time 1642530761.327, thread 0xfffffea7a8a76580: Assertion Failure time = 1642530761 cpuid = 24, TSC = 0xe457b789d574ac Panic occurred in module kernel loaded at 0xffffffff80200000: Stack: -------------------------------------------------- kernel:isi_assert_halt+0x2e kernel:pdm_entries_get_cacheable_entry+0x48e kernel:pdm_entries_get+0x95 kernel:pdm_entries_get_global+0x33 kernel:pdm_get_painted_domids+0x2e2 kernel:pdm_member_generate_entry+0xda kernel:pdm_member_get_membership_entry+0x1b7 kernel:pdm_member_init_operation+0x16d kernel:ifm_init_operation+0xb7 kernel:txn_i_include_vnode_to_list+0xc0 kernel:pdm_vget_adsio_txn_include+0x12c kernel:pdm_domain_paint_adsdir+0x41 kernel:pdm_unlink+0x1f0 kernel:bam_rename+0x2bcb kernel:ifs_vnop_wraprename+0x96 kernel:VOP_RENAME_APV+0x9b isi_lwext.ko:lwextsvc_rename+0xe35 kernel:amd64_syscall+0x380 -------------------------------------------------- *** FAILED ASSERTION !pdm_lk_is_held(domid, PDM_EXCLUSIVE) @ /b/mnt/src/sys/ifs/pdm/pdm_ops.c:443: Disabling swatchdog Dumping stacks (40960 bytes)
Cause
Forårsaket av følgende feil: PSCALE-63084: FAILED ASSERTION !pdm_lk_is_held(domid, PDM_EXCLUSIVE) @ /b/mnt/src/sys/ifs/pdm/pdm_ops.c:443 During ADS rename
Dette problemet er relatert til ADS-arbeidsflyt (alternative datastrømmer). Alternative datastrømmer er en datastruktur som brukes i Windows som lagrer metadatatyper med informasjon om en fil, for eksempel kommentarer om en fil. Det finnes ikke i FreeBSD (som er det underliggende filsystemet til OneFS på Isilon), men OneFS støtter det, og det behandles som en fil i OneFS.
Kappløpssituasjonen oppstår når OneFS gir nytt navn til en ADS-fil på tvers av en domenegrense (i eller utenfor øyeblikksbilde) for å overskrive en hardt koblet ADS-fil. Dette fører til at en node slutter å svare når en operasjon ble forsøkt. Som et resultat kan det oppstå utilgjengelighet av data (DU).
Hvordan finne ut om en klynge er i faresonen for dette problemet?
Klyngen kjører OneFS-kode eldre enn 9.3.0.0
.Hvis arbeidsflyten ikke bruker ADS- og navneendringsoperasjoner, vil ikke OneFS oppleve dette problemet.
Résolution
Oppgrader til OneFS versjon 9.3.0.0 eller nyere.
Løsningen:
PowerScale-støtte kan om nødvendig studere den innsamlede minidumpen fra noden med panikk for å gjøre det enklere for oss å identifisere hvilken fil/mappe som var tilknyttet panikken.