PowerScale: Паника узлов: Ошибка утверждения Ядро:pdm_entries_get_cacheable_entry+0x48e
Sommaire: Несколько узлов PowerScale вызывают панику со стеком: Ошибка утверждения ядро:pdm_entries_get_cacheable_entry+0x48e, ядро:pdm_member_generate_entry+0xda
Symptômes
Несколько узлов PowerScale вызывают панику со стеком:
ipfw2 (+ipv6) initialized, divert loadable, nat loadable, default to accept, logging disabled mce2: Interface stopped DISTRIBUTING, possible flapping panic @ time 1642530761.327, thread 0xfffffea7a8a76580: Assertion Failure time = 1642530761 cpuid = 24, TSC = 0xe457b789d574ac Panic occurred in module kernel loaded at 0xffffffff80200000: Stack: -------------------------------------------------- kernel:isi_assert_halt+0x2e kernel:pdm_entries_get_cacheable_entry+0x48e kernel:pdm_entries_get+0x95 kernel:pdm_entries_get_global+0x33 kernel:pdm_get_painted_domids+0x2e2 kernel:pdm_member_generate_entry+0xda kernel:pdm_member_get_membership_entry+0x1b7 kernel:pdm_member_init_operation+0x16d kernel:ifm_init_operation+0xb7 kernel:txn_i_include_vnode_to_list+0xc0 kernel:pdm_vget_adsio_txn_include+0x12c kernel:pdm_domain_paint_adsdir+0x41 kernel:pdm_unlink+0x1f0 kernel:bam_rename+0x2bcb kernel:ifs_vnop_wraprename+0x96 kernel:VOP_RENAME_APV+0x9b isi_lwext.ko:lwextsvc_rename+0xe35 kernel:amd64_syscall+0x380 -------------------------------------------------- *** FAILED ASSERTION !pdm_lk_is_held(domid, PDM_EXCLUSIVE) @ /b/mnt/src/sys/ifs/pdm/pdm_ops.c:443: Disabling swatchdog Dumping stacks (40960 bytes)
Cause
Вызывается следующим дефектом: PSCALE-63084: FAILED ASSERTION !pdm_lk_is_held(domid, PDM_EXCLUSIVE) @ /b/mnt/src/sys/ifs/pdm/pdm_ops.c:443 During ADS rename
Эта проблема связана с рабочим процессом ADS (альтернативные потоки данных). Альтернативные потоки данных — это структура данных, используемая в Windows, в которой хранятся метаданные типа сведений о файле, например комментариев к файлу. Он не существует во FreeBSD (которая является базовой файловой системой OneFS в Isilon), но OneFS поддерживает его, и он рассматривается как файл в OneFS.
Состояние гонки возникает, когда OneFS переименовывает файл ADS через границу домена (в моментальный снимок или за его пределами), чтобы перезаписать жестко связанный файл ADS. Это приводит к тому, что узел перестает отвечать при попытке выполнения операции. В результате может возникнуть недоступность данных (DU).
Как определить, подвержен ли кластер риску возникновения этой проблемы?
В кластере используется код OneFS старше версии 9.3.0.0.
Если рабочий процесс не использует ADS и операции переименования, эта проблема не возникнет в OneFS.
Résolution
Выполните модернизацию до OneFS версии 9.3.0.0 или более поздней.
Решение:
При необходимости служба поддержки PowerScale может изучить мини-дамп, собранный на узле, подвергшемся критической ошибке, чтобы определить, какой файл или папка были связаны с сбоем.