PowerScale: panik för noder: Assertion Failure-kärna: pdm_entries_get_cacheable_entry+0x48e
Résumé: Flera PowerScale-noder får panik med stacken: Kontrollfel kernel:pdm_entries_get_cacheable_entry+0x48e, kernel:pdm_member_generate_entry+0xda
Symptômes
Flera PowerScale-noder får panik med stacken:
ipfw2 (+ipv6) initialized, divert loadable, nat loadable, default to accept, logging disabled mce2: Interface stopped DISTRIBUTING, possible flapping panic @ time 1642530761.327, thread 0xfffffea7a8a76580: Assertion Failure time = 1642530761 cpuid = 24, TSC = 0xe457b789d574ac Panic occurred in module kernel loaded at 0xffffffff80200000: Stack: -------------------------------------------------- kernel:isi_assert_halt+0x2e kernel:pdm_entries_get_cacheable_entry+0x48e kernel:pdm_entries_get+0x95 kernel:pdm_entries_get_global+0x33 kernel:pdm_get_painted_domids+0x2e2 kernel:pdm_member_generate_entry+0xda kernel:pdm_member_get_membership_entry+0x1b7 kernel:pdm_member_init_operation+0x16d kernel:ifm_init_operation+0xb7 kernel:txn_i_include_vnode_to_list+0xc0 kernel:pdm_vget_adsio_txn_include+0x12c kernel:pdm_domain_paint_adsdir+0x41 kernel:pdm_unlink+0x1f0 kernel:bam_rename+0x2bcb kernel:ifs_vnop_wraprename+0x96 kernel:VOP_RENAME_APV+0x9b isi_lwext.ko:lwextsvc_rename+0xe35 kernel:amd64_syscall+0x380 -------------------------------------------------- *** FAILED ASSERTION !pdm_lk_is_held(domid, PDM_EXCLUSIVE) @ /b/mnt/src/sys/ifs/pdm/pdm_ops.c:443: Disabling swatchdog Dumping stacks (40960 bytes)
Cause
Orsakas av följande defekt: PSCALE-63084: FAILED ASSERTION !pdm_lk_is_held(domid, PDM_EXCLUSIVE) @ /b/mnt/src/sys/ifs/pdm/pdm_ops.c:443 During ADS rename
Det här problemet är relaterat till ADS-arbetsflödet (alternativa dataströmmar). Alternativa dataströmmar är en datastruktur som används i Windows och som lagrar metadatatyper av information om en fil, till exempel kommentarer om en fil. Det finns inte i FreeBSD (som är det underliggande filsystemet för OneFS på Isilon), men OneFS stöder det och det behandlas som en fil inom OneFS.
Konkurrenstillståndet uppstår när OneFS byter namn på en ADS-fil över en domängräns (in eller ut ur ögonblicksbild) för att skriva över en hårt länkad ADS-fil. Detta gör att en nod slutar svara när en åtgärd har gjorts. Därför kan dataotillgänglighet (DU) uppstå.
Hur tar jag reda på om ett kluster är i riskzonen för det här problemet?
Klustret kör OneFS-kod som är äldre än 9.3.0.0.
Om arbetsflödet inte använder ADS- och "byt namn"-åtgärder kommer OneFS inte att uppleva det här problemet.
Résolution
Uppgradera till OneFS version 9.3.0.0 eller senare.
Workaround:
Om det behövs kan PowerScale-supporten studera den insamlade minidumpen från den panikslagna noden för att hjälpa oss att identifiera vilken fil/mapp som var associerad med paniken.