Dell Unity: Los hosts Linux montados mediante NFSv4.2 en Unity que ejecutan OE 5.5 causan estados de alarma del SP
Summary: En Unity 5.5, el acceso al sistema de archivos (FS) se puede proporcionar mediante un montaje de sistema de archivos de red (NFS) mediante protocolos de uso compartido de archivos NFSv3 o NFSv4. Por lo general, esto se hace para almacenes de datos NFS y números de unidad lógica (LUN) con parámetros de montaje específicos y, a continuación, se ejecuta en scripts para varios grupos de hosts. Cuando se montan recursos compartidos de archivos mediante NFSv4.2, se crea un directorio para el punto de montaje. Si el parámetro de etiqueta de seguridad de directorio (sec_label) no tiene datos asignados, los procesadores de servicio (SP) de Unity pueden entrar en estado de alarma y reiniciarse inesperadamente. ...
Symptoms
En Unity OE 5.5, se agregó compatibilidad con NFSv4.2 con los parámetros de modo y sec_label que se utilizarán durante el proceso de montaje de NFS.
- En ciertas situaciones de montaje de script NFSv4.2 para crear un directorio para el punto de montaje, si el sec_label no tiene datos asignados, los procesadores del sistema (SP) de Unity pueden experimentar un estado de alarma de SIGSEGV y reiniciarse inesperadamente.
- Uno o ambos SP pueden entrar en estado de alarma debido a una condición de carrera entre un cambio de nombre y una lista de directorios. Esto puede provocar que el sistema quede inactivo y que uno o ambos SP se activen en modo de rescate.
Ejemplo de salida de estado de alarma de los registros de Unity:
B 05/14/25 19:01:09 CSX RT: panic requested at: <file-unknown>:0 (thread: 139634334762752 aka 139634334762752) [PID:7138 TID:9862 CORE:1 [csx_ic_std.x] [nfs09_007] [05/14/2025 19:01:09 UTC]] (panic action:DEFAULT expr:<no-expr> flags:-) [info:0] B 05/14/25 19:01:09 CSX RT: Fatal: Process received SIGSEGV: B 05/14/25 19:01:09 SIGSEGV(SEGV_MAPERR)@0x20 B 05/14/25 19:01:09 CSX RT: panic backtrace: [26ec0700] 00007f159e87ab34 <csx_rt_proc_request_backtrace +0x00000154> (sp=00007f159eb45440) proc=7f159e87a9e0-7f159e87b01d csx_urt.so B 05/14/25 19:01:09 CSX RT: panic backtrace: [26ec0700] 00007f159e846a27 <csx_rt_assert_request_panic +0x000000b7> (sp=00007f159eb46380) proc=7f159e846970-7f159e846a3b csx_urt.so B 05/14/25 19:01:09 CSX RT: panic backtrace: [26ec0700] 00007f159e878727 <csx_rt_proc_int_handle_fatal_signal +0x000002d7> (sp=00007f159eb464a0) proc=7f159e878450-7f159e8788f2 csx_urt.so B 05/14/25 19:01:09 CSX RT: panic backtrace: [26ec0700] 00007f159e87d543 <csx_rt_proc_int_handle_sigsegv +0x000001b3> (sp=00007f159eb46520) proc=7f159e87d390-7f159e87d597 csx_urt.so B 05/14/25 19:01:09 CSX RT: panic backtrace: [26ec0700] 00007f1545d20ea9 <_ZN13nfs4_attrhold17nfs4SetattrVerifyEjRPj+0x00000049> (sp=00007eff26ebed10) proc=7f1545d20e60-7f1545d20f90 cdx.so B 05/14/25 19:01:09 CSX RT: panic backtrace: [26ec0700] 00007f1545d217be <_Z13nfs4_secLabeliiP14nfs4_attr_infoP8nfs4_ctxP13nfs4_attrholdP15File_NamingNodeP17Access_Credential+0x0000075e> (sp=00007eff26ebed60) proc=7f1545d21060-7f1545d21823 cdx.so
Nota: Los estados de alarma no ocurren en todos los intentos de montaje de NFSv4.2 y algunos funcionan sin problemas.
Si se producen estados de alarma del SP, comuníquese con el soporte de Dell y consulte este artículo para investigar el estado del sistema. No intente solucionar los problemas de los SP sin la orientación del equipo de soporte.
Cause
El código actual de Unity OE 5.5 no puede manejar el atributo sec_label sin datos asignados. Como resultado, el SP accede a un puntero de memoria nulo, lo que provoca un estado de alarma de SIGSEGV. Además, el código 5.5 puede encontrar una condición de carrera entre una lista de directorios y una operación de cambio de nombre, lo que genera subprocesos bloqueados y un estado de alarma de tiempo de espera agotado de vigilancia.
Resolution
Corregir:
La condición de carrera se corrigió en la versión 5.5.2 de Dell Unity OE. Actualice a esta versión para solucionar este problema.
Ingeniería aún está abordando el problema del sec_label en blanco . Consulte este artículo de la base de conocimientos para obtener más actualizaciones. Mientras tanto, las siguientes soluciones alternativas pueden solucionar el problema del sec_label en blanco.
Solución alternativa:
Utilice el siguiente artículo para deshabilitar la etiqueta de seguridad de NFSv4.2:
- Dell Unity: Cómo deshabilitar la etiqueta de seguridad mediante NFS en Unity OE 5.5 (corregible por el usuario) (Se requiere iniciar sesión como usuario registrado del soporte de Dell para ver este artículo).
En el artículo, también se muestran las siguientes soluciones alternativas, que también solucionarán ambos problemas:
- Monte los servidores Linux utilizando únicamente NFSv3, NFSv4 o NFSv4.1
- Parámetro para degradar la versión de NFSv4 máxima admitida a 4.1
Additional Information
Un directorio de punto de montaje NFSv4.2 "create request" en un host Linux que proporciona información de modo y sec_label afecta la solicitud de las siguientes maneras:
- Modo: Este parámetro especifica los permisos para el nuevo directorio. Define los permisos de lectura, escritura y ejecución para el propietario, el grupo y otros. Por ejemplo, un modo 0755 otorga permisos de lectura, escritura y ejecución al propietario, y permisos de lectura y ejecución al grupo y a otros. Esto garantiza que el directorio se cree con los controles de acceso correctos.
- Sec_label: Este parámetro se utiliza para aplicar etiquetas de seguridad al directorio. Sec_labels forman parte del sistema de control de acceso obligatorio (MAC), que proporciona un control de acceso más detallado en comparación con el control de acceso discrecional (DAC) tradicional. Cuando se crea un directorio con un sec_label, el servidor NFS almacena y recupera estas etiquetas, lo que garantiza que el directorio cumpla con las políticas de seguridad especificadas.
Esto es útil en entornos que requieren un estricto cumplimiento de normas de seguridad.
En este artículo, se explica qué es un estado de alarma de memoria de SIGSEGV: Dell Unity: El procesador de almacenamiento detectó un estado de alarma con la causa SIGSEGV