PowerScale: Noder-panik: Assertion Failure-kerne:pdm_entries_get_cacheable_entry+0x48e
Résumé: Flere PowerScale-noder får panik med stakken: Assertion Failure: kernel:pdm_entries_get_cacheable_entry+0x48e, kernel:pdm_member_generate_entry+0xda
Symptômes
Flere PowerScale-noder får panik med stakken:
ipfw2 (+ipv6) initialized, divert loadable, nat loadable, default to accept, logging disabled mce2: Interface stopped DISTRIBUTING, possible flapping panic @ time 1642530761.327, thread 0xfffffea7a8a76580: Assertion Failure time = 1642530761 cpuid = 24, TSC = 0xe457b789d574ac Panic occurred in module kernel loaded at 0xffffffff80200000: Stack: -------------------------------------------------- kernel:isi_assert_halt+0x2e kernel:pdm_entries_get_cacheable_entry+0x48e kernel:pdm_entries_get+0x95 kernel:pdm_entries_get_global+0x33 kernel:pdm_get_painted_domids+0x2e2 kernel:pdm_member_generate_entry+0xda kernel:pdm_member_get_membership_entry+0x1b7 kernel:pdm_member_init_operation+0x16d kernel:ifm_init_operation+0xb7 kernel:txn_i_include_vnode_to_list+0xc0 kernel:pdm_vget_adsio_txn_include+0x12c kernel:pdm_domain_paint_adsdir+0x41 kernel:pdm_unlink+0x1f0 kernel:bam_rename+0x2bcb kernel:ifs_vnop_wraprename+0x96 kernel:VOP_RENAME_APV+0x9b isi_lwext.ko:lwextsvc_rename+0xe35 kernel:amd64_syscall+0x380 -------------------------------------------------- *** FAILED ASSERTION !pdm_lk_is_held(domid, PDM_EXCLUSIVE) @ /b/mnt/src/sys/ifs/pdm/pdm_ops.c:443: Disabling swatchdog Dumping stacks (40960 bytes)
Cause
Forårsaget af følgende defekt: PSCALE-63084: FAILED ASSERTION !pdm_lk_is_held(domid, PDM_EXCLUSIVE) @ /b/mnt/src/sys/ifs/pdm/pdm_ops.c:443 During ADS rename
Dette problem er relateret til ADS-arbejdsprocessen (alternative datastrømme). Alternative datastrømme er en datastruktur, der bruges i Windows, og som gemmer metadatatyper af oplysninger om en fil, f.eks. kommentarer til en fil. Det findes ikke i FreeBSD (som er det underliggende filsystem i OneFS på Isilon), men OneFS understøtter det, og det behandles som en fil i OneFS.
Race-betingelsen opstår, når OneFS omdøber en ADS-fil på tværs af en domænegrænse (ind eller ud af snapshot) for at overskrive en hårdt sammenkædet ADS-fil. Dette medfører, at en node ikke reagerer, når en handling blev forsøgt. Som følge heraf kan data utilgængelighed (DU) forekomme.
Hvordan finder man ud af, om en klynge er i fare for dette problem?
Klyngen kører OneFS-kode, der er ældre end 9.3.0.0.
Hvis workflowet ikke bruger ADS- og "omdøb"-handlinger, oplever OneFS ikke dette problem.
Résolution
Opgrader til OneFS-version 9.3.0.0 eller nyere.
Løsning:
Hvis det er nødvendigt, kan PowerScale Support studere det indsamlede minidump fra den panikslagne node for at hjælpe os med at identificere, hvilken fil/mappe der var forbundet med panikken.