PowerScale: вузли панікують: Ядро невдачі твердження: pdm_entries_get_cacheable_entry+0x48e
Résumé: Декілька вузлів PowerScale панікують зі стеком: Ядро Assertion Failure:pdm_entries_get_cacheable_entry+0x48e, ядро:pdm_member_generate_entry+0xda
Symptômes
Декілька вузлів PowerScale панікують зі стеком:
ipfw2 (+ipv6) initialized, divert loadable, nat loadable, default to accept, logging disabled mce2: Interface stopped DISTRIBUTING, possible flapping panic @ time 1642530761.327, thread 0xfffffea7a8a76580: Assertion Failure time = 1642530761 cpuid = 24, TSC = 0xe457b789d574ac Panic occurred in module kernel loaded at 0xffffffff80200000: Stack: -------------------------------------------------- kernel:isi_assert_halt+0x2e kernel:pdm_entries_get_cacheable_entry+0x48e kernel:pdm_entries_get+0x95 kernel:pdm_entries_get_global+0x33 kernel:pdm_get_painted_domids+0x2e2 kernel:pdm_member_generate_entry+0xda kernel:pdm_member_get_membership_entry+0x1b7 kernel:pdm_member_init_operation+0x16d kernel:ifm_init_operation+0xb7 kernel:txn_i_include_vnode_to_list+0xc0 kernel:pdm_vget_adsio_txn_include+0x12c kernel:pdm_domain_paint_adsdir+0x41 kernel:pdm_unlink+0x1f0 kernel:bam_rename+0x2bcb kernel:ifs_vnop_wraprename+0x96 kernel:VOP_RENAME_APV+0x9b isi_lwext.ko:lwextsvc_rename+0xe35 kernel:amd64_syscall+0x380 -------------------------------------------------- *** FAILED ASSERTION !pdm_lk_is_held(domid, PDM_EXCLUSIVE) @ /b/mnt/src/sys/ifs/pdm/pdm_ops.c:443: Disabling swatchdog Dumping stacks (40960 bytes)
Cause
Спричинений наступним дефектом: PSCALE-63084: FAILED ASSERTION !pdm_lk_is_held(domid, PDM_EXCLUSIVE) @ /b/mnt/src/sys/ifs/pdm/pdm_ops.c:443 During ADS rename
Ця проблема пов'язана з робочим процесом ADS (альтернативні потоки даних). Альтернативні потоки даних — це структура даних, що використовується в Windows, яка зберігає метадані типів інформації про файл, наприклад, коментарів про файл. Вона не існує у FreeBSD (яка є базовою файловою системою OneFS на Isilon), але OneFS підтримує її і розглядається як файл у межах OneFS.
Умова гонки виникає, коли OneFS перейменовує файл ADS через межу домену (у знімку або поза ним), щоб перезаписати жорстко зв'язаний ADS-файл. Це призводить до того, що вузол стає нечутливим під час спроби операції. У результаті може виникнути недоступність даних (DU).
Як визначити, чи є кластер під загрозою цієї проблеми?
Кластер працює на OneFS-коді, старшому за 9.3.0.0.
Якщо workflow не використовує ADS і операції «перейменування», то OneFS не зіткнеться з цією проблемою.
Résolution
Оновіть до OneFS версії 9.3.0.0 або вище.
Обхідний шлях:
За потреби підтримка PowerScale може дослідити зібраний мінідамп із панічного вузла, щоб допомогти визначити, який файл/папка пов'язана з панікою.