Dell Unity: Unity inacessível após a reinicialização da controladora primária durante o upgrade

Summary: Este artigo explica por que os serviços de gerenciamento do Unity ficam inacessíveis após a reinicialização da controladora primária durante um upgrade. (Pode ser corrigido pelo usuário) ...

This article applies to This article does not apply to This article is not tied to any specific product. Not all product versions are identified in this article.

Symptoms

A controladora primária é reinicializada durante o processo de upgrade.

Os serviços de gerenciamento do Unity ficam inacessíveis durante a reinicialização da controladora primária do processo de upgrade de código.

O IP do Unity não recebe ping, e o Unisphere não carrega.

O acesso aos dados não é afetado.

Cause

No Unity, a controladora primária lida com serviços de gerenciamento (o endereço IP).
Quando a controladora primária é reinicializada, os serviços de gerenciamento sofrem failover para a controladora secundária (par).

Edição 1:
Se a controladora secundária não estiver conectada à mesma rede de gerenciamento que a primária, o IP do Unity se tornará inacessível quando o serviço de gerenciamento sofrer failover.

Exemplo:
Antes do upgrade:
  • A SP A é primária e a SP B é secundária
  • A SP A está conectada à rede de gerenciamento da qual o Unisphere é acessado.
  • A SP B não está conectada à mesma rede que a SP A.
Quando a SP A é reinicializada durante o upgrade:
  • A SP B se torna primária e a SP A se torna secundária.
  • Como os serviços de gerenciamento estão com a SP B, o IP de gerenciamento do Unity fica inacessível.
Edição 2:
Um segundo problema pode ocorrer quando o failover entre SPs acontece e falsificamos o endereço MAC na nova SP. Alguns ambientes do usuário podem estar pegando o novo endereço MAC "duplicado" e bloqueando o acesso à porta do switch, causando a perda de acesso.
 
Nota: Um novo aprimoramento do utilitário Pre-Upgrade Health Check (PUHC) foi introduzido no Unity OE 5.3 e posterior.

Esse aprimoramento verifica possíveis problemas de conectividade nas portas de gerenciamento. Consulte Dell Unity: A verificação de integridade pré-upgrade é concluída com advertência: platform::check_management_port_2 (pode ser corrigido pelo usuário)
Test of the management port configuration indicates there may be a problem with the management port VLAN settings that could cause loss of management functionality during storage processor reboots associated with the upgrade. Some valid network configurations can also make this test fail. Ensure that the alternate management port is properly configured. See KB#000066048 for recommended VLAN management port guidelines. You can safely ignore this warning if there is not a real issue.
Captura de tela da interface do usuário do aviso de PUHC:


Captura de tela do novo aviso de PUHC
essa mensagem de advertência indica que o array Unity não pôde confirmar a conectividade de rede de gerenciamento do par da controladora de armazenamento (SP). O novo aprimoramento do PUHC do Unity OE 5.3 inicia um teste ARP (Address Resolution Protocol, protocolo de resolução de endereços) na rede. Isso serve para confirmar qualquer problema de conectividade no par da controladora de armazenamento, caso as operações de gerenciamento sofram failover para o par da controladora.

O PUHC envia um teste ARP em vez de um ping ARP padrão. O endereço IP de gerenciamento só está ativo na controladora primária, não no par. Esse é o motivo pelo qual a verificação deve ser um teste ARP no par. A controladora não primária (par) não tem um endereço IP configurado para um ARP padrão. Portanto, a solicitação ARP deve ser enviada com 0.0.0.0 preenchido e é um teste ARP.

A mensagem de advertência ocorrerá se uma resposta não for recebida do teste ARP.

Essa advertência não significa que o link da porta estava inativo para uma porta de gerenciamento da SP antes do upgrade. Se esse fosse o problema, a verificação de integridade pré-upgrade o detectaria (conforme abordado no artigo da Dell Dell Unity: A verificação de integridade falha com [Código de erro: platform::check_peer_management_port_link_2] (corrigível pelo usuário)

Resolution

Durante o PUHC antes do upgrade:
A mensagem de aviso abaixo é um aviso suave e não uma falha:
Warning Code: platform::check_management_port_2
Use uma das opções no artigo abaixo para fazer failover das operações de gerenciamento para o par da controladora de armazenamento a fim de testar se o par da controladora tem conectividade com a rede. Dell Unity: Como executar um failover dos serviços de gerenciamento (ECOM) (corrigível pela Dell)

Uma opção adicional para esse artigo é reinicializar a controladora primária atual para operações de gerenciamento de failover no par da controladora. As operações de gerenciamento podem ser perdidas até 10 minutos durante o processo de failover. Depois que as operações de gerenciamento forem recuperadas, verifique se o par da controladora de armazenamento agora é a controladora primária. Se as operações de gerenciamento estiverem funcionando com êxito na SPA e na SPB após testes de failover, essa mensagem de advertência poderá ser ignorada com segurança.

Durante o upgrade:
Esse aviso poderá ser ignorado se não tiver sido visto até o meio do upgrade. Clique no botão "Tentar novamente" para prosseguir com o upgrade.  

Entre em contato com o Suporte Dell e mencione este artigo da base de conhecimento caso o botão "Repetir" não funcione.

Após um upgrade bem-sucedido:
O aviso abaixo
Warning Code: platform::check_management_port_2
Pode ser ignorado com segurança se essa mensagem de advertência tiver sido recebida após um upgrade bem-sucedido para o Unity OE 5.3 ou posterior.

Additional Information

Este artigo da KB se aplica a todas as reinicializações da controladora primária e não apenas aos upgrades.

Exemplos do problema: 
  • Em um caso, uma SP estava conectada à rede de gerenciamento enquanto o outro cabo de gerenciamento da SP estava conectado a algum switch iSCSI.
  • Em outro caso, uma SP estava conectada à rede de gerenciamento enquanto o outro cabo de gerenciamento da SP estava conectado à porta do switch que se conecta a outra rede por uma VLAN diferente.
A partir do Unity OE versão 5.3, um novo teste faz parte do utilitário PUHC (Pre-Upgrade Health Check, verificação de integridade pré-upgrade) para verificar essa condição.  Esse teste verificará as controladoras primária e secundária.  O novo teste (que é diferente do teste atual em que verificamos para garantir que as portas não estejam inativas) usará o utilitário "arp ping" (arping) para testar se a interface permite o tráfego do Protocolo de resolução de endereços (ARP) por meio de sua interface.  Geralmente, os switches são configurados para bloquear difusões de ARP entre VLANs, portanto, na maioria dos casos, esse teste seria confiável para determinar se as VLANs para as portas de gerenciamento estão configuradas corretamente.  Esse teste pode produzir um falso negativo se o comutador estiver configurado para permitir difusões entre VLANs e o teste poderá produzir um falso positivo quando as difusões forem desativadas, mesmo dentro de uma VLAN.  Mas, na maioria dos casos, em condições normais, esse novo teste determinará se as portas de gerenciamento estão configuradas corretamente em uma VLAN.

Affected Products

Dell EMC Unity Family

Products

Dell EMC Unity Family |Dell EMC Unity All Flash, Dell EMC Unity Family, Dell EMC Unity Hybrid
Article Properties
Article Number: 000066048
Article Type: Solution
Last Modified: 21 Jun 2024
Version:  8
Find answers to your questions from other Dell users
Support Services
Check if your device is covered by Support Services.