Dell Unity. Хосты Linux, смонтированные с использованием NFSv4.2 в Unity с операционной средой версии 5.5, вызывают сбой процессора СХД
Summary: В Unity 5.5 доступ к файловой системе (FS) может быть предоставлен с помощью монтирования Network File System (NFS) с использованием протоколов общего доступа к файлам NFSv3 или NFSv4. Обычно это делается для логических номеров Unity (LUN) и хранилищ данных NFS с определенными параметрами монтирования, а затем используется сценарий для различных групп хостов. Для точки монтирования при монтировании общих файловых ресурсов с помощью NFSv4.2 создается каталог. Если параметру метки безопасности каталога (sec_label) не назначены данные, сервисные процессоры Unity (SP) могут вызвать панику и неожиданно перезагрузиться. ...
Symptoms
В Unity OE 5.5 добавлена поддержка NFSv4.2 с параметрами mode и sec_label, которые будут использоваться в процессе монтирования NFS.
- В некоторых сценариях монтирования скрипта NFSv4.2 для создания каталога для точки монтирования, если для sec_label не назначены данные, системные процессоры (СХД) Unity могут столкнуться с критической ошибкой SIGSEGV и неожиданно перезагрузиться.
- В одном или обоих процессорах СХД может произойти критическая ошибка из-за состояния гонки между переименованием и перечислением каталогов. Это может привести к выходу системы из строя и переходу одного или обоих процессоров СХД в режим восстановления.
Пример выходных данных о критической ошибке из журналов Unity:
B 05/14/25 19:01:09 CSX RT: panic requested at: <file-unknown>:0 (thread: 139634334762752 aka 139634334762752) [PID:7138 TID:9862 CORE:1 [csx_ic_std.x] [nfs09_007] [05/14/2025 19:01:09 UTC]] (panic action:DEFAULT expr:<no-expr> flags:-) [info:0] B 05/14/25 19:01:09 CSX RT: Fatal: Process received SIGSEGV: B 05/14/25 19:01:09 SIGSEGV(SEGV_MAPERR)@0x20 B 05/14/25 19:01:09 CSX RT: panic backtrace: [26ec0700] 00007f159e87ab34 <csx_rt_proc_request_backtrace +0x00000154> (sp=00007f159eb45440) proc=7f159e87a9e0-7f159e87b01d csx_urt.so B 05/14/25 19:01:09 CSX RT: panic backtrace: [26ec0700] 00007f159e846a27 <csx_rt_assert_request_panic +0x000000b7> (sp=00007f159eb46380) proc=7f159e846970-7f159e846a3b csx_urt.so B 05/14/25 19:01:09 CSX RT: panic backtrace: [26ec0700] 00007f159e878727 <csx_rt_proc_int_handle_fatal_signal +0x000002d7> (sp=00007f159eb464a0) proc=7f159e878450-7f159e8788f2 csx_urt.so B 05/14/25 19:01:09 CSX RT: panic backtrace: [26ec0700] 00007f159e87d543 <csx_rt_proc_int_handle_sigsegv +0x000001b3> (sp=00007f159eb46520) proc=7f159e87d390-7f159e87d597 csx_urt.so B 05/14/25 19:01:09 CSX RT: panic backtrace: [26ec0700] 00007f1545d20ea9 <_ZN13nfs4_attrhold17nfs4SetattrVerifyEjRPj+0x00000049> (sp=00007eff26ebed10) proc=7f1545d20e60-7f1545d20f90 cdx.so B 05/14/25 19:01:09 CSX RT: panic backtrace: [26ec0700] 00007f1545d217be <_Z13nfs4_secLabeliiP14nfs4_attr_infoP8nfs4_ctxP13nfs4_attrholdP15File_NamingNodeP17Access_Credential+0x0000075e> (sp=00007eff26ebed60) proc=7f1545d21060-7f1545d21823 cdx.so
Примечание. Сбои возникают не при каждой попытке монтирования NFSv4.2, и некоторые из них работают без проблем.
При возникновении паники процессора СХД обратитесь в службу поддержки Dell и ознакомьтесь с этой статьей, чтобы выяснить состояние системы. Не пытайтесь устранять неполадки процессоров СХД без помощи службы поддержки.
Cause
Текущий код операционной среды Unity версии 5.5 не может обработать атрибут sec_label без назначенных данных. В результате процессор СХД обращается к нулевому указателю памяти, вызывая критическую ошибку SIGSEGV. Кроме того, в коде 5.5 может возникать состояние гонки между перечислением каталогов и операцией переименования, что приводит к блокировке потоков и критической ошибке тайм-аута таймера наблюдения.
Resolution
Исправление:
Состояние гонки исправлено в операционной среде Dell Unity версии 5.5.2. Пожалуйста, обновите его до этой версии, чтобы устранить эту проблему.
Проблема с пустым sec_label все еще находится на рассмотрении в инженерном отделе. Следите за дальнейшими обновлениями в этой статье базы знаний. В то же время, приведенные ниже временные решения могут помочь решить проблему пустого sec_label.
Временное решение.
Для отключения метки безопасности NFSv4.2 используйте следующую статью:
- Dell Unity. Как отключить Security Label over NFS в Unity OE 5.5 (исправляется пользователем) (для просмотра этой статьи необходимо войти в систему в качестве зарегистрированного пользователя службы поддержки Dell Support.)
В статье также представлены следующие временные решения, которые также позволяют обойти обе эти проблемы.
- Монтируйте серверы Linux только с использованием NFSv3, NFSv4 или NFSv4.1
- Параметр для понижения максимально поддерживаемой версии NFSv4 до 4.1
Additional Information
Каталог точки монтирования NFSv4.2 «создать запрос» на хосте Linux, который предоставляет информацию о режиме и sec_label, влияет на запрос следующим образом:
- Режим: Этот параметр определяет разрешения для нового каталога. Он определяет разрешения на чтение, запись и запуск для владельца, группы и других пользователей. Например, в режиме 0755 владельцу предоставляются разрешения на чтение, запись и запуск, а группе и другим пользователям — разрешения на чтение и запуск. Это гарантирует, что каталог создается с правильными элементами управления доступом.
- Sec_label: Этот параметр используется для нанесения меток безопасности на каталог. Sec_labels являются частью системы обязательного контроля доступа (MAC), которая обеспечивает более точный контроль доступа по сравнению с традиционным дискреционным контролем доступа (DAC). При создании каталога с sec_label сервер NFS сохраняет и извлекает эти метки, обеспечивая соответствие каталога указанным политикам безопасности.
Это полезно в средах, требующих строгого соответствия требованиям безопасности.
В этой статье описывается, что такое паника памяти SIGSEGV. Dell Unity. Процессор СХД столкнулся с критической ошибкой по причине SIGSEGV