PowerScale: errore irreversibile nei nodi con stack: Errore asserzione kernel:pdm_update_membership+0x10b2

Summary: Errore irreversibile in più nodi con stack: Errore asserzione kernel:pdm_update_membership+0x10b2

This article applies to This article does not apply to This article is not tied to any specific product. Not all product versions are identified in this article.

Symptoms

Errore irreversibile in più nodi con stack:
 

2022-03-03T14:40:11.340255-05:00 <0.7> (id12) /boot/kernel.amd64/kernel: panic @ time 1646335137.652, thread 0xfffffe8ffa3b8080: Assertion Failure
2022-03-03T14:40:11.340297-05:00 <5.3> (id12) syslogd: sendto: Network is unreachable
2022-03-03T14:40:11.340317-05:00 <5.3>  syslogd: last message repeated 1 times
2022-03-03T14:40:11.340322-05:00 <0.7> (id12) /boot/kernel.amd64/kernel: time = 1646335137
2022-03-03T14:40:11.340334-05:00 <0.7> (id12) /boot/kernel.amd64/kernel: cpuid = 15, TSC = 0xc868113bb278f
2022-03-03T14:40:11.340340-05:00 <0.7> (id12) /boot/kernel.amd64/kernel: Panic occurred in module kernel loaded at 0xffffffff80200000:
2022-03-03T14:40:11.340347-05:00 <0.7> (id12) /boot/kernel.amd64/kernel:
2022-03-03T14:40:11.340353-05:00 <0.7> (id12) /boot/kernel.amd64/kernel: Stack: --------------------------------------------------
2022-03-03T14:40:11.340359-05:00 <0.7> (id12) /boot/kernel.amd64/kernel: kernel:isi_assert_halt+0x2e
2022-03-03T14:40:11.340365-05:00 <0.7> (id12) /boot/kernel.amd64/kernel: kernel:pdm_update_membership+0x10b2
2022-03-03T14:40:11.340371-05:00 <0.7> (id12) /boot/kernel.amd64/kernel: kernel:pdm_get_painted_domids+0x568
2022-03-03T14:40:11.340377-05:00 <0.7> (id12) /boot/kernel.amd64/kernel: kernel:pdm_member_generate_entry+0xda
2022-03-03T14:40:11.340383-05:00 <0.7> (id12) /boot/kernel.amd64/kernel: kernel:pdm_member_get_membership_entry+0x1b7
2022-03-03T14:40:11.340390-05:00 <0.7> (id12) /boot/kernel.amd64/kernel: kernel:pdm_member_init_operation+0x16d
2022-03-03T14:40:11.340396-05:00 <0.7> (id12) /boot/kernel.amd64/kernel: kernel:ifm_init_operation+0xb7
2022-03-03T14:40:11.340402-05:00 <0.7> (id12) /boot/kernel.amd64/kernel: kernel:txn_i_include_vnode_to_list+0xc0
--
2022-03-03T14:40:11.340440-05:00 <0.7> (id12) /boot/kernel.amd64/kernel: kernel:VOP_RENAME_APV+0x9b
2022-03-03T14:40:11.340446-05:00 <0.7> (id12) /boot/kernel.amd64/kernel: kernel:isi_kern_renameat+0x37e
2022-03-03T14:40:11.340452-05:00 <0.7> (id12) /boot/kernel.amd64/kernel: kernel:sys_enc_renameat+0x27
2022-03-03T14:40:11.340458-05:00 <0.7> (id12) /boot/kernel.amd64/kernel: kernel:amd64_syscall+0x380
2022-03-03T14:40:11.340464-05:00 <0.7> (id12) /boot/kernel.amd64/kernel: --------------------------------------------------
2022-03-03T14:40:11.340471-05:00 <0.3> (id12) /boot/kernel.amd64/kernel: *** FAILED ASSERTION !domid_vec_empty(new_domids) && !pdm_is_non_ifs_vec(new_domids) ==> new_domids->domids[0] == PDM_ROOT_DOMID @ /b/mnt/src/sys/ifs/pdm/pdm_core.c:660: Invalid membership: [ 1.000000074fc.0001 ]
 

Cause

Causato dal seguente difetto: PSCALE-118595


Questo problema è correlato al flusso di lavoro ADS (flussi di dati alternativi). I flussi di dati alternativi sono una struttura di dati utilizzata all'interno di Windows in cui sono archiviati i tipi di metadati delle informazioni relative a un file, ad esempio i commenti relativi a un file. Non esiste in FreeBSD (che è il file system sottostante di OneFS su Isilon), ma OneFS lo supporta e viene considerato come un file all'interno di OneFS.
 

Come determinare se un cluster è a rischio di questo problema?

L'insorgenza di questo difetto sul campo è rara.

Affinché questa race condition si attivi, TUTTE le seguenti condizioni devono essere vere:

Il cluster esegue una versione di OneFS inferiore a 9.4.0.0.

Il file ha più di un elemento principale (file con collegamento reale).

Al file deve essere associato ADS.

I dati del file risiedono nel cloud storage (nessun dato locale su disco).

Rinominare uno dei link principali in un altro dominio (ad esempio, una posizione diversa per le snapshot).

 

Resolution

Soluzione definitiva: 
Eseguire l'aggiornamento a una di queste versioni di OneFS o a una successiva che includa la correzione:

OneFS 9.4.0.0
PATCH: [9.3.0.5_GA-RUP_2022-03] PSP-1956
PATCH: [9.2.1.10_GA-RUP_2022-03] PSP-2075
PATCH: [9.1.0.14_GA-RUP_2021-12] PSP-1722

Una soluzione alternativa sarebbe complicata per questo scenario.  Dovremmo rimuovere i file interessati da CloudPools e renderli disponibili solo localmente. È meglio eseguire l'aggiornamento e risolvere direttamente il problema.

Article Properties
Article Number: 000201796
Article Type: Solution
Last Modified: 02 Mar 2026
Version:  2
Find answers to your questions from other Dell users
Support Services
Check if your device is covered by Support Services.