PowerScale: Fehler bei Nodes: Assertionsfehler Kernel:pdm_entries_get_cacheable_entry+0x48e
Résumé: Mehrere PowerScale-Nodes haben einen Fehler mit dem Stack: Assertionsfehler kernel:pdm_entries_get_cacheable_entry+0x48e, kernel:pdm_member_generate_entry+0xda
Symptômes
Mehrere PowerScale-Nodes haben einen Fehler mit dem Stack:
ipfw2 (+ipv6) initialized, divert loadable, nat loadable, default to accept, logging disabled mce2: Interface stopped DISTRIBUTING, possible flapping panic @ time 1642530761.327, thread 0xfffffea7a8a76580: Assertion Failure time = 1642530761 cpuid = 24, TSC = 0xe457b789d574ac Panic occurred in module kernel loaded at 0xffffffff80200000: Stack: -------------------------------------------------- kernel:isi_assert_halt+0x2e kernel:pdm_entries_get_cacheable_entry+0x48e kernel:pdm_entries_get+0x95 kernel:pdm_entries_get_global+0x33 kernel:pdm_get_painted_domids+0x2e2 kernel:pdm_member_generate_entry+0xda kernel:pdm_member_get_membership_entry+0x1b7 kernel:pdm_member_init_operation+0x16d kernel:ifm_init_operation+0xb7 kernel:txn_i_include_vnode_to_list+0xc0 kernel:pdm_vget_adsio_txn_include+0x12c kernel:pdm_domain_paint_adsdir+0x41 kernel:pdm_unlink+0x1f0 kernel:bam_rename+0x2bcb kernel:ifs_vnop_wraprename+0x96 kernel:VOP_RENAME_APV+0x9b isi_lwext.ko:lwextsvc_rename+0xe35 kernel:amd64_syscall+0x380 -------------------------------------------------- *** FAILED ASSERTION !pdm_lk_is_held(domid, PDM_EXCLUSIVE) @ /b/mnt/src/sys/ifs/pdm/pdm_ops.c:443: Disabling swatchdog Dumping stacks (40960 bytes)
Cause
Verursacht durch den folgenden Fehler: PSCALE-63084: FAILED ASSERTION !pdm_lk_is_held(domid, PDM_EXCLUSIVE) @ /b/mnt/src/sys/ifs/pdm/pdm_ops.c:443 During ADS rename
Dieses Problem hängt mit dem ADS-Workflow (alternative Datenströme) zusammen. Alternative Datenströme sind eine Datenstruktur, die in Windows verwendet wird und Metadatentypen von Informationen zu einer Datei speichert, z. B. Kommentare zu einer Datei. Sie ist in FreeBSD (dem zugrunde liegenden Dateisystem von OneFS auf Isilon) nicht vorhanden, wird aber von OneFS unterstützt und als Datei in OneFS behandelt.
Die Race-Bedingung tritt auf, wenn OneFS eine ADS-Datei über eine Domaingrenze hinweg (innerhalb oder außerhalb des Snapshots) umbenennt, um eine fest verknüpfte ADS-Datei zu überschreiben. Dies führt dazu, dass ein Node nicht mehr reagiert, wenn ein Vorgang versucht wurde. Infolgedessen kann es zu einer Nichtverfügbarkeit von Daten (DU) kommen.
Wie kann festgestellt werden, ob ein Cluster durch dieses Problem gefährdet ist?
Auf dem Cluster wird OneFS-Code ausgeführt, der älter als 9.3.0.0 ist.
Wenn der Workflow keine ADS- und Umbenennungsvorgänge verwendet, tritt dieses Problem bei OneFS nicht auf.
Résolution
Führen Sie ein Upgrade auf OneFS Version 9.3.0.0 oder höher durch.
Problemumgehung:
Falls erforderlich, kann der PowerScale-Support das erfasste Minidump des in Panik geratenen Node untersuchen, um uns dabei zu helfen, die Datei/den Ordner zu identifizieren, die bzw. der mit dem Fehler in Verbindung stand.