Dell Unity: Hosts Linux montados usando NFSv4.2 no Unity que executam o OE 5.5 causam panes da SP
Summary: No Unity 5.5, o acesso ao FS (File System) pode ser fornecido usando uma montagem NFS (Network File System) usando protocolos de compartilhamento de arquivos NFSv3 ou NFSv4. Isso geralmente é feito para datastores Logical Unity Numbers (LUN) e NFS com parâmetros específicos de montagem e, em seguida, scripted para vários grupos de hosts. Um diretório é criado para o ponto de montagem ao montar compartilhamentos de arquivos usando o NFSv4.2. Se o parâmetro do rótulo de segurança de diretório (sec_label) não tiver dados atribuídos a ele, as controladoras de serviço (SP) do Unity podem entrar em pane e reinicializar inesperadamente. ...
Symptoms
No Unity OE 5.5, o suporte para NFSv4.2 foi adicionado com parâmetros de modo e sec_label a serem usados durante o processo de montagem do NFS.
- Em determinados cenários de montagem de script NFSv4.2 para criar um diretório para o ponto de montagem, se o sec_label não tiver dados atribuídos a ele, os processadores de sistema (SP) do Unity podem identificar uma pane de SIGSEGV e reinicializar inesperadamente.
- Uma ou ambas as SPs podem entrar em pane devido a uma condição de corrida entre uma renomeação e uma listagem de diretório. Isso pode fazer com que o sistema fique inativo e uma ou ambas as controladoras de armazenamento entrem no modo de resgate.
Exemplo de saída de pane de logs do Unity:
B 05/14/25 19:01:09 CSX RT: panic requested at: <file-unknown>:0 (thread: 139634334762752 aka 139634334762752) [PID:7138 TID:9862 CORE:1 [csx_ic_std.x] [nfs09_007] [05/14/2025 19:01:09 UTC]] (panic action:DEFAULT expr:<no-expr> flags:-) [info:0] B 05/14/25 19:01:09 CSX RT: Fatal: Process received SIGSEGV: B 05/14/25 19:01:09 SIGSEGV(SEGV_MAPERR)@0x20 B 05/14/25 19:01:09 CSX RT: panic backtrace: [26ec0700] 00007f159e87ab34 <csx_rt_proc_request_backtrace +0x00000154> (sp=00007f159eb45440) proc=7f159e87a9e0-7f159e87b01d csx_urt.so B 05/14/25 19:01:09 CSX RT: panic backtrace: [26ec0700] 00007f159e846a27 <csx_rt_assert_request_panic +0x000000b7> (sp=00007f159eb46380) proc=7f159e846970-7f159e846a3b csx_urt.so B 05/14/25 19:01:09 CSX RT: panic backtrace: [26ec0700] 00007f159e878727 <csx_rt_proc_int_handle_fatal_signal +0x000002d7> (sp=00007f159eb464a0) proc=7f159e878450-7f159e8788f2 csx_urt.so B 05/14/25 19:01:09 CSX RT: panic backtrace: [26ec0700] 00007f159e87d543 <csx_rt_proc_int_handle_sigsegv +0x000001b3> (sp=00007f159eb46520) proc=7f159e87d390-7f159e87d597 csx_urt.so B 05/14/25 19:01:09 CSX RT: panic backtrace: [26ec0700] 00007f1545d20ea9 <_ZN13nfs4_attrhold17nfs4SetattrVerifyEjRPj+0x00000049> (sp=00007eff26ebed10) proc=7f1545d20e60-7f1545d20f90 cdx.so B 05/14/25 19:01:09 CSX RT: panic backtrace: [26ec0700] 00007f1545d217be <_Z13nfs4_secLabeliiP14nfs4_attr_infoP8nfs4_ctxP13nfs4_attrholdP15File_NamingNodeP17Access_Credential+0x0000075e> (sp=00007eff26ebed60) proc=7f1545d21060-7f1545d21823 cdx.so
Nota: As panes não ocorrem em todas as tentativas de montagem do NFSv4.2 e algumas funcionam sem problemas.
Se ocorrerem panes de controladoras de armazenamento, entre em contato com o Suporte Dell e consulte este artigo para investigar o status do sistema. Não tente solucionar problemas das controladoras de armazenamento sem orientação do suporte.
Cause
O código atual do Unity OE 5.5 não pode manipular o atributo sec_label sem dados atribuídos. Como resultado, a SP acessa um ponteiro de memória nulo causando uma pane SIGSEGV. Além disso, o código 5.5 pode encontrar uma condição de corrida entre uma listagem de diretórios e uma operação de renomeação, resultando em threads bloqueados e uma pane de tempo de espera excedido do watchdog.
Resolution
Correção:
A condição de corrida foi corrigida no Dell Unity OE versão 5.5.2. Faça upgrade para esta versão a fim de corrigir esse problema.
O problema do sec_label em branco ainda está sendo tratado pela engenharia. Assista a este artigo da base de conhecimento para obter mais atualizações. Enquanto isso, as soluções alternativas abaixo podem contornar o problema de sec_label em branco.
Solução temporária:
Use o seguinte artigo para desativar o rótulo de segurança do NFSv4.2:
- Dell Unity: Como desativar a etiqueta de segurança por NFS no Unity OE 5.5 (corrigível pelo usuário) (É necessário fazer login como um usuário registrado do Suporte Dell para visualizar este artigo.)
O artigo também mostra as seguintes soluções temporárias, que também funcionarão em torno desses dois problemas:
- Monte os servidores Linux usando apenas NFSv3, NFSv4 ou NFSv4.1
- Parâmetro para fazer downgrade da versão máxima compatível do NFSv4 para a 4.1
Additional Information
Um diretório de ponto de montagem NFSv4.2 "criar solicitação" em um host Linux que fornece informações de modo e sec_label afeta a solicitação das seguintes maneiras:
- Modo: Este parâmetro especifica as permissões para o novo diretório. Ele define as permissões de leitura, gravação e execução para o proprietário, o grupo e outros. Por exemplo, um modo 0755 concede permissões de leitura, gravação e execução ao proprietário e permissões de leitura e execução ao grupo e a outros. Isso garante que o diretório seja criado com os controles de acesso corretos.
- Sec_label: Esse parâmetro é usado para aplicar rótulos de segurança ao diretório. Sec_labels fazem parte do sistema de controle de acesso obrigatório (MAC), que fornece um controle de acesso mais refinado em comparação com o controle de acesso discricionário (DAC) tradicional. Quando um diretório é criado com um sec_label, o servidor NFS armazena e recupera esses rótulos, garantindo que o diretório siga as políticas de segurança especificadas.
Isso é útil em ambientes que exigem estrita conformidade de segurança.
Este artigo discute o que é uma pane de memória SIGSEGV: Dell Unity: A controladora de armazenamento encontrou pane com a causa SIGSEGV