ECS: OBS: xDoctor: RAP099: xDoctor não uniforme em todos os nós
Summary: Este artigo da KB explica por que XDR_OBS_099 é relatado porque o xDoctor não é uniforme em todos os nós.
Symptoms
O xDoctor é uma ferramenta de suporte e diagnóstico projetada para identificar e ajudar a resolver problemas conhecidos de configuração, software e hardware que podem afetar negativamente os sistemas ECS e OBS. Os principais recursos incluem:
- Solução de problemas: Ajuda as equipes de suporte e os clientes a identificar as causas raiz dos problemas do ECS e do OBS.
- Monitoramento proativo: Detecta os primeiros sinais de problemas
- Engajamento do suporte: Algumas ações e resoluções exigem o envolvimento do Suporte Dell.
O xDoctor está relatando o seguinte erro:
------------------------------------------------------
ERROR - xDoctor not uniform across all nodes
------------------------------------------------------
Extra = Not allowed to use the SYSTEM scope, use LOCAL scope instead or reinstall xDoctor -> xdr_versions={'4.8-85.0': ['169.254.1.3'], '4.8-100.1': ['169.254.1.4', '169.254.1.2', '169.254.1.1']}
RAP = RAP099
Solution = KB 91703
Timestamp = 2025-10-09_120102
PSNT = CKM00000000000 @ 4.8-100.1
Como resultado, o diagnóstico ECS é limitado ao escopo local. Isso significa que apenas um pequeno conjunto de detectores de sintomas pode ser testado e nem todos os relatórios de telemetria podem ser coletados e enviados para casa.
Para confirmar que a versão do xDoctor não é uniforme, SSH a um nó para verificar conforme abaixo:
# sudo xdoctor -s xDoctor not uniform across all nodes ... Trying xDoctor Resync ... Resync failed: No xDoctor package found for re-installation [4.8-85.0] -> ['169.254.1.3'] [4.8-100.1] -> ['169.254.1.4', '169.254.1.2', '169.254.1.1']
No exemplo acima, o nó 3 está executando o xDoctor 4.8-85.0, enquanto os nós 1, 2 e 4 estão executando o xDoctor 4.8-100.1.
Cause
- Um nó foi reinstalado ou ficou off-line durante as atualizações do xDoctor.
- Um nó é substituído e a nova versão do xDoctor não é uniforme com os outros nós.
- Expansão de capacidade com novos nós com uma versão mais antiga do xDoctor
Resolution
É altamente recomendável resolver isso, pois isso leva a exibições de topologia incompletas da base de instalação e desconhecimento de sintomas conhecidos.
Embora sincronizar o nó seja a solução, a melhor recomendação é fazer upgrade do xDoctor em todos os nós para o mais recente para todos os detectores de sintomas e autocorredores ativados. Auto healers foram introduzidos em versões posteriores do xDoctor.
Observe que, ao fazer download do pacote xDoctor, isso depende da versão do seu código no ECS e no OBS. Observe também os formatos de arquivo abaixo:
- ECS (3.8 e anteriores): o pacote do xDoctor começa com a versão 4.x. (Exemplo: 4.8-105.0) — Página de suporte ao produto ECS (é necessário fazer login para fazer download do pacote)
- OBS (3.9 e superior): o pacote do xDoctor começa com 5.x (exemplo: 5.1-105.0) - Página de suporte ao produto OBS (é necessário fazer login para baixar o pacote)
|
Para fazer upgrade do xDoctor para a versão mais recente, siga as etapas da KB do ECS: OBS: xDoctor: Procedimento de upgrade manual:
Consulte o Exemplo 1 na seção Informações adicionais para fazer upgrade do xDoctor para a versão mais recente. |
|
Se houver alguma restrição com a atualização do xDoctor para a versão mais recente, podemos sincronizar a última versão no sistema local. Siga as etapas descritas no artigo da KB ECS: OBS: xDoctor: Procedimento de upgrade manual:
Consulte o Exemplo 2 na seção Informações adicionais para tornar todos os nós do xDoctor uniformes para a última versão. |
Depois que o xDoctor for atualizado para a versão mais recente, confirme se a versão do xDoctor é uniforme em todos os nós do rack:
# sudo xdoctor -s xDoctor Uniform on all nodes: 4.8-105.0.
Se for necessária alguma assistência com as etapas acima, entre em contato com o suporte técnico da Dell consultando este artigo da KB.
Additional Information
Veja abaixo exemplos fornecidos de acordo com a seção de resolução:
Exemplo 1 — Fazer upgrade do xDoctor para a versão
mais recente Confirme o sintoma de que o xDoctor não é uniforme em todos os nós — abaixo, os nós 1 a 5 estão no xDoctor 4.8-102.0, enquanto os nós 6-10 estão no 4.8-95.0:
# sudo xdoctor -s xDoctor not uniform across all nodes ... Trying xDoctor Resync ... Resync failed: No xDoctor package found for re-installation [4.8-102.0] -> ['169.254.2.1', '169.254.2.2', '169.254.2.3', '169.254.2.4', '169.254.2.5'] [4.8-95.0] -> ['169.254.2.10', '169.254.2.11', '169.254.2.8', '169.254.2.9', '169.254.2.6', '169.254.2.7']
Depois que a versão mais recente do xDoctor for carregada no nó 1 para /home/admin, confirme se ele existe:
# ls -l /home/admin | grep xDoctor -rw-r--r-- 1 admin users 43793804 Apr 14 08:21 xDoctor4ECS-4.8-102.0.noarch.rpm -rw-r--r-- 1 root root 121382804 Oct 9 11:34 xDoctor4ECS-4.8-105.0.noarch.rpm
Faça upgrade do xDoctor para o mais recente e ative todos os curadores automáticos:
# sudo xdoctor --upgrade --local=/home/admin/xDoctor4ECS-4.8-105.0.noarch.rpm
This new xDoctor RPM has the following Auto Healers:
┌──────────────┐
│ Auto Healers │
└───┬──────────┘
│
│ time_zone = Enabled
│ pmon_crontab_check = Disabled
│ pmon_swapiness_check = Disabled
│ rsyslogd_check = Disabled
│ task_md_cleanup_status = Disabled
│ ntpd_not_running (New) = Disabled
│ cron_not_running (New) = Disabled
│ machines_file_error (New) = Disabled
│ non_uniform_psnt (New) = Disabled
│ racadm_stale_pid (New) = Disabled
│ obj_control_svc_check (New) = Disabled
In order to have them active, they need to be enabled ...
You can do this during this upgrade or later post upgrade via `xdoctor --config`
Would you like to enable (A)ll, only the (N)ew ones or (I)gnore them [I]: A
2025-10-09 11:36:15,663: xDoctor_4.8-102.0 - INFO : User selected to enable all Auto Healers ...
2025-10-09 11:36:15,663: xDoctor_4.8-102.0 - INFO : Local Upgrade (/home/admin/xDoctor4ECS-4.8-105.0.noarch.rpm)
2025-10-09 11:36:15,696: xDoctor_4.8-102.0 - INFO : Current Installed xDoctor version is 4.8-102.0
2025-10-09 11:36:15,712: xDoctor_4.8-102.0 - INFO : Requested package version is 4.8-105.0
2025-10-09 11:36:15,713: xDoctor_4.8-102.0 - INFO : Updating xDoctor RPM Package (RPM)
2025-10-09 11:36:15,935: xDoctor_4.8-102.0 - INFO : - Distribute package
2025-10-09 11:36:17,402: xDoctor_4.8-102.0 - INFO : - Install new rpm package
2025-10-09 11:36:33,562: xDoctor_4.8-102.0 - INFO : Enabling Auto Healer: pmon_crontab_check ...
2025-10-09 11:36:33,563: xDoctor_4.8-102.0 - INFO : Enabling Auto Healer: pmon_swapiness_check ...
2025-10-09 11:36:33,563: xDoctor_4.8-102.0 - INFO : Enabling Auto Healer: rsyslogd_check ...
2025-10-09 11:36:33,563: xDoctor_4.8-102.0 - INFO : Enabling Auto Healer: task_md_cleanup_status ...
2025-10-09 11:36:33,563: xDoctor_4.8-102.0 - INFO : Enabling Auto Healer: ntpd_not_running ...
2025-10-09 11:36:33,563: xDoctor_4.8-102.0 - INFO : Enabling Auto Healer: cron_not_running ...
2025-10-09 11:36:33,563: xDoctor_4.8-102.0 - INFO : Enabling Auto Healer: machines_file_error ...
2025-10-09 11:36:33,563: xDoctor_4.8-102.0 - INFO : Enabling Auto Healer: non_uniform_psnt ...
2025-10-09 11:36:33,563: xDoctor_4.8-102.0 - INFO : Enabling Auto Healer: racadm_stale_pid ...
2025-10-09 11:36:33,563: xDoctor_4.8-102.0 - INFO : Enabling Auto Healer: obj_control_svc_check ...
2025-10-09 11:36:33,828: xDoctor_4.8-102.0 - INFO : Auto Healer Settings saved and distributed ...
┌──────────────────────┐
│ Updated Auto Healers │
└───┬──────────────────┘
│
│ time_zone = Enabled
│ pmon_crontab_check = Enabled
│ pmon_swapiness_check = Enabled
│ rsyslogd_check = Enabled
│ task_md_cleanup_status = Enabled
│ ntpd_not_running (New) = Enabled
│ cron_not_running (New) = Enabled
│ machines_file_error (New) = Enabled
│ non_uniform_psnt (New) = Enabled
│ racadm_stale_pid (New) = Enabled
│ obj_control_svc_check (New) = Enabled
2025-10-09 11:36:33,829: xDoctor_4.8-102.0 - INFO : xDoctor successfully updated to version 4.8-105.0
Confirme se o xDoctor agora é uniforme em todos os nós:
# sudo xdoctor -s xDoctor Uniform on all nodes: 4.8-105.0
Exemplo 2: uniformizar todos os nós do xDoctor à última versão no sistema local.
Confirme o sintoma de que o xDoctor não é uniforme em todos os nós — abaixo, os nós 1, 2 e 4 estão no xDoctor 4.8-100.1, enquanto os nós 3 estão no 4.8-85.0:
# sudo xdoctor -s xDoctor not uniform across all nodes ... Trying xDoctor Resync ... Resync failed: No xDoctor package found for re-installation [4.8-85.0] -> ['169.254.1.3'] [4.8-100.1] -> ['169.254.1.4', '169.254.1.2', '169.254.1.1']
Nos nós 1 (preferencialmente), 2 ou 4, confirme se o pacote xDoctor 4.8-100.1 existe em /home/admin:
# ls -l /home/admin | grep xDoctor -rw-r--r-- 1 admin users 43793804 Mar 4 08:21 xDoctor4ECS-4.8-99.0.noarch.rpm -rw-r--r-- 1 root root 121382804 Sep 2 11:34 xDoctor4ECS-4.8-100.1.noarch.rpm
Reinstale o pacote do xDoctor:
sudo xdoctor --upgrade --local=/home/admin/xDoctor4ECS-4.8-100.1.noarch.rpm --reinstall 2025-10-09 12:24:19,996: xDoctor_4.8-100.1 - INFO : Local Upgrade (/home/admin/xDoctor4ECS-4.8-100.1.noarch.rpm) 2025-10-09 12:24:20,029: xDoctor_4.8-100.1 - INFO : Current Installed xDoctor version is 4.8-100.1 2025-10-09 12:24:20,046: xDoctor_4.8-100.1 - INFO : Requested package version is 4.8-100.1 2025-10-09 12:24:20,046: xDoctor_4.8-100.1 - WARNING : (Re)installing requested xDoctor package ... 2025-10-09 12:24:20,046: xDoctor_4.8-100.1 - INFO : Updating xDoctor RPM Package (RPM) 2025-10-09 12:24:20,176: xDoctor_4.8-100.1 - INFO : - Distribute package 2025-10-09 12:24:21,745: xDoctor_4.8-100.1 - INFO : - Install new rpm package 2025-10-09 12:24:37,095: xDoctor_4.8-100.1 - INFO : xDoctor successfully updated to version 4.8-100.1
Confirme se o xDoctor agora é uniforme em todos os nós:
sudo -i xdoctor -s xDoctor Uniform on all nodes: 4.8-100.1