PowerScale : nodes panic : Assertion Failure kernel :pdm_entries_get_cacheable_entry+0x48e
Résumé: Fonctionnement inattendu de plusieurs nœuds PowerScale avec la pile : Assertion Failure kernel :pdm_entries_get_cacheable_entry+0x48e, kernel :pdm_member_generate_entry+0xda
Symptômes
Fonctionnement inattendu de plusieurs nœuds PowerScale avec la pile :
ipfw2 (+ipv6) initialized, divert loadable, nat loadable, default to accept, logging disabled mce2: Interface stopped DISTRIBUTING, possible flapping panic @ time 1642530761.327, thread 0xfffffea7a8a76580: Assertion Failure time = 1642530761 cpuid = 24, TSC = 0xe457b789d574ac Panic occurred in module kernel loaded at 0xffffffff80200000: Stack: -------------------------------------------------- kernel:isi_assert_halt+0x2e kernel:pdm_entries_get_cacheable_entry+0x48e kernel:pdm_entries_get+0x95 kernel:pdm_entries_get_global+0x33 kernel:pdm_get_painted_domids+0x2e2 kernel:pdm_member_generate_entry+0xda kernel:pdm_member_get_membership_entry+0x1b7 kernel:pdm_member_init_operation+0x16d kernel:ifm_init_operation+0xb7 kernel:txn_i_include_vnode_to_list+0xc0 kernel:pdm_vget_adsio_txn_include+0x12c kernel:pdm_domain_paint_adsdir+0x41 kernel:pdm_unlink+0x1f0 kernel:bam_rename+0x2bcb kernel:ifs_vnop_wraprename+0x96 kernel:VOP_RENAME_APV+0x9b isi_lwext.ko:lwextsvc_rename+0xe35 kernel:amd64_syscall+0x380 -------------------------------------------------- *** FAILED ASSERTION !pdm_lk_is_held(domid, PDM_EXCLUSIVE) @ /b/mnt/src/sys/ifs/pdm/pdm_ops.c:443: Disabling swatchdog Dumping stacks (40960 bytes)
Cause
Causé par le défaut suivant : PSCALE-63084: FAILED ASSERTION !pdm_lk_is_held(domid, PDM_EXCLUSIVE) @ /b/mnt/src/sys/ifs/pdm/pdm_ops.c:443 During ADS rename
Ce problème est lié au workflow ADS (alternate data streams). Alternate Data Streams est une structure de données utilisée dans Windows qui stocke des informations de type métadonnées sur un fichier, telles que des commentaires sur un fichier. Il n’existe pas dans FreeBSD (qui est le système de fichiers sous-jacent de OneFS sur Isilon), mais OneFS le prend en charge et il est traité comme un fichier dans OneFS.
La condition de concurrence se produit lorsque OneFS renomme un fichier ADS sur une limite de domaine (dans ou hors snapshot) afin d’écraser un fichier ADS lié physiquement. Cela fait qu’un nœud ne répond plus lorsqu’une opération a été tentée. Par conséquent, une indisponibilité des données (DU) peut se produire.
Comment déterminer si un cluster est exposé à ce problème ?
Le cluster exécute du code OneFS antérieur à la version 9.3.0.0.
Si le workflow n’utilise pas les opérations ADS et « rename », OneFS ne rencontrera pas ce problème.
Résolution
Effectuez une mise à niveau vers OneFS version 9.3.0.0 ou supérieure.
Contournement:
Si nécessaire, le support PowerScale peut étudier le minividage collecté à partir du nœud activé afin de nous aider à identifier le fichier/dossier associé au fonctionnement inattendu.