Dell Unity: A GUI e a CLI do Unisphere via SSH não estão mais acessíveis após a tentativa de alterar as configurações do DNS (corrigível pela Dell)

Summary: A GUI e a CLI do Unisphere via SSH não são mais acessíveis após a tentativa de alterar as configurações de DNS. Reiniciar os serviços de gerenciamento não resolve o problema. Também foi determinado que o ECOM não inicia ou permanece em execução por mais de 10 minutos. ...

This article applies to This article does not apply to This article is not tied to any specific product. Not all product versions are identified in this article.

Symptoms

A GUI e a CLI do Unisphere não podem mais ser acessadas após a tentativa de alterar as configurações de DNS. Reiniciar os serviços de gerenciamento não resolve o problema. Também foi determinado que o ECOM não é executado em nenhuma das controladoras de armazenamento nem permanece em execução por mais de 10 minutos.

Tentar usar o seguinte KB para reiniciar o MGMT não resolve o problema:

Dell Unity: Não é possível acessar o Unisphere O sistema está ocupado. Tente novamente mais tarde (corrigível pelo usuário)
https://www.dell.com/support/kbdoc/000056109
Command: svc_restart_service restart MGMT
A coleta de dados mostrou que havia dump files do ECOM. 

A reinicialização de cada sp por KB 000021439 permitia que o ECOM funcionava, mas apenas por 10 minutos por vez. 

Dell Unity: Como recuperar ou solucionar problemas quando o serviço de gerenciamento (ECOM) não está em execução em qualquer SP (corrigível pelo usuário)
https://www.dell.com/support/kbdoc/000021439

Cause

O problema ocorre quando um comando DNS "papi_clust_set.sh dns xxx" tem o tempo limite excedado e causa uma pane no ECOM. Isso também pode ocorrer ao usar o Unisphere para alterar as configurações de DNS ou para remover um novo servidor DNS.

Nota: A ferramenta IPMI deve ser usada para se conectar a uma das controladoras de armazenamento para solucionar problemas, pois o ECOM está inativo.  

A triagem e a análise de registros mostraram trabalhos em lote suspensos de uma tentativa com falha de fazer alterações de DNS no sistema Unity. 

Comando usado para verificar: uemcli /sys/task/job show -detail Os registros internos mostraram o seguinte: 
 
cemtracer_sysapi logs 18 Jul 2023 21:51:36 - [SYSAPI] ERROR - {0:777251:881779993}[1053|3741|f70d6b40][doTimeoutAction @ /c4_working/Unity_PullRequest_Build_Driver_Sles15_RTM_1.1/clariion/components/adapters/SystemAPI/framework/src/ConfigMgr.cpp:403] Timeout action (poll): abort Aborting the system. 
Os dumps do ECOM podem mostrar sinais semelhantes aos seguintes:

Pesquisar por "erro" no cemtracer_sysapi.log mostrou:
xx Nov xxxx 13:27:52  - [SYSAPI] ERROR - {0:24803979:204377483}[18921|28516|f70d6b40][_watchDogRoutine @ /c4_working/Unity_PullRequest_Build_Driver_Sles15_RTM_1.1/clariion/components/adapters/SystemAPI/framework/src/UpdateManagerImpl.cpp:1511] Watch dog poll request timeout occured. Now:24803979204 TimeGap:900621 Is in Poll:0
xx Nov xxxx 13:27:52  - [SYSAPI] ERROR - {0:24803979:205104121}[18921|28516|f70d6b40][_watchDogRoutine @ /c4_working/Unity_PullRequest_Build_Driver_Sles15_RTM_1.1/clariion/components/adapters/SystemAPI/framework/src/UpdateManagerImpl.cpp:1512] PerfStatReport:
xx Nov xxxx 13:27:52  - [SYSAPI] ERROR - {0:24803979:206876577}[18921|28516|f70d6b40][_watchDogRoutine @ /c4_working/Unity_PullRequest_Build_Driver_Sles15_RTM_1.1/clariion/components/adapters/SystemAPI/framework/src/UpdateManagerImpl.cpp:1516] dependencyMap:
xx Nov xxxx 13:27:52  - [SYSAPI] ERROR - {0:24803979:206905718}[18921|28516|f70d6b40][doTimeoutAction @ /c4_working/Unity_PullRequest_Build_Driver_Sles15_RTM_1.1/clariion/components/adapters/SystemAPI/framework/src/ConfigMgr.cpp:403] Timeout action (poll): abort
xx Nov xxxx 23:16:07  - [SYSAPI] ERROR - {0:1379:344272630}[2919|6108|f17ffb40][Poll @ /c4_working/Unity_PullRequest_Build_Driver_Sles15_RTM_1.1/clariion/components/adapters/SystemAPI/framework/src/TLDPollManager.cpp:383] Admin PEER poll request failed.Error Code = 7e110000.
xx Nov xxxx 23:16:58  - [SYSAPI] ERROR - {0:1429:454592292}[2919|20591|d79ffb40][performRequestBase @ /c4_working/Unity_PullRequest_Build_Driver_Sles15_RTM_1.1/clariion/components/adapters/SystemAPI/framework/src/util/TLDUtils.cpp:346] Admin failed to process request (err = 2115043355):
  TAG_K10_ERROR_PACKET (0x10004)
   TAG_K10_ERROR_CODE (0x10005) num: 2115043355 (0x7e11001b) str: "...~" hex: 1b:0:11:7e
xx Nov xxxx 23:31:15  - [SYSAPI] ERROR - {0:2286:652151017}[2919|6535|f70d6b40][_watchDogRoutine @ /c4_working/Unity_PullRequest_Build_Driver_Sles15_RTM_1.1/clariion/components/adapters/SystemAPI/framework/src/UpdateManagerImpl.cpp:1511] Watch dog poll request timeout occured. Now:2286652 TimeGap:900650 Is in Poll:0
xx Nov xxxx 23:31:15  - [SYSAPI] ERROR - {0:2286:652504752}[2919|6535|f70d6b40][_watchDogRoutine @ /c4_working/Unity_PullRequest_Build_Driver_Sles15_RTM_1.1/clariion/components/adapters/SystemAPI/framework/src/UpdateManagerImpl.cpp:1512] PerfStatReport:
xx Nov xxxx 23:31:15  - [SYSAPI] ERROR - {0:2286:653466119}[2919|6535|f70d6b40][_watchDogRoutine @ /c4_working/Unity_PullRequest_Build_Driver_Sles15_RTM_1.1/clariion/components/adapters/SystemAPI/framework/src/UpdateManagerImpl.cpp:1516] dependencyMap:
xx Nov xxxx 23:31:15  - [SYSAPI] ERROR - {0:2286:653504952}[2919|6535|f70d6b40][doTimeoutAction @ /c4_working/Unity_PullRequest_Build_Driver_Sles15_RTM_1.1/clariion/components/adapters/SystemAPI/framework/src/ConfigMgr.cpp:403] Timeout action (poll): abort

Resolution

Isso é resolvido no Unity OE 5.2.0 e superior. Se os trabalhos pararem de responder, entre em contato com o suporte técnico da Dell e mencione este artigo. Trabalhos travados podem ser vistos no Unisphere na seção Event/Jobs. O suporte ajudará a limpar os trabalhos travados usando a seção Interna da KB 000059274. 

Dell Unity: Excluindo trabalhos em lote travados ou suspensos, Código de erro: 0x7d13151 (corrigível pela Dell)


https://www.dell.com/support/kbdoc/en-us/000059274/dell-emc-unity-deleting-stuck-or-suspended-batch-jobs-error-code-0x7d13151 depois que os trabalhos travados forem removidos, o serviço ECOM deve ser reiniciado usando a KB 000019807. 

Dell Unity: Como executar um failover de serviços de gerenciamento (ECOM) (corrigível pela Dell)
https://www.dell.com/support/kbdoc/000019807

Additional Information

Referência: UnityD-54308, UnityD-59297, UEE-16306, UEE-17969

Affected Products

Dell EMC Unity
Article Properties
Article Number: 000216591
Article Type: Solution
Last Modified: 26 Oct 2023
Version:  3
Find answers to your questions from other Dell users
Support Services
Check if your device is covered by Support Services.