ECS: OBS: xDoctor: RAP099: xDoctor no es uniforme en todos los nodos
Summary: En este artículo de la base de conocimientos, se explica por qué se informa XDR_OBS_099 debido a que xDoctor no es uniforme en todos los nodos.
Symptoms
xDoctor es una herramienta de diagnóstico y soporte diseñada para identificar y ayudar a resolver problemas conocidos de configuración, software y hardware que pueden afectar negativamente a los sistemas ECS y OBS. Las características clave incluyen:
- Solución de problemas: Ayuda a los equipos de soporte y a los clientes a identificar las causas raíz de los problemas de ECS y OBS.
- Monitoreo proactivo: Detecta los primeros signos de problemas
- Participación de soporte: Algunas acciones y resoluciones requieren la participación del soporte de Dell.
xDoctor informa el siguiente error:
------------------------------------------------------
ERROR - xDoctor not uniform across all nodes
------------------------------------------------------
Extra = Not allowed to use the SYSTEM scope, use LOCAL scope instead or reinstall xDoctor -> xdr_versions={'4.8-85.0': ['169.254.1.3'], '4.8-100.1': ['169.254.1.4', '169.254.1.2', '169.254.1.1']}
RAP = RAP099
Solution = KB 91703
Timestamp = 2025-10-09_120102
PSNT = CKM00000000000 @ 4.8-100.1
Como resultado, el diagnóstico de ECS se limita al alcance local. Esto significa que solo se puede probar un pequeño conjunto de detectores de síntomas, y no todos los informes de telemetría se pueden recopilar y enviar a casa.
Para confirmar que la versión de xDoctor no es uniforme, SSH a un nodo para verificar como se muestra a continuación:
# sudo xdoctor -s xDoctor not uniform across all nodes ... Trying xDoctor Resync ... Resync failed: No xDoctor package found for re-installation [4.8-85.0] -> ['169.254.1.3'] [4.8-100.1] -> ['169.254.1.4', '169.254.1.2', '169.254.1.1']
En el ejemplo anterior, el nodo 3 ejecuta xDoctor 4.8-85.0, mientras que los nodos 1, 2 y 4 ejecutan xDoctor 4.8-100.1.
Cause
- Un nodo se reinstala o estaba offline durante las actualizaciones de xDoctor.
- Se reemplaza un nodo y la nueva versión de xDoctor del nodo no es uniforme con los demás nodos.
- Expansión de capacidad con nodos nuevos que tienen una versión anterior de xDoctor
Resolution
Se recomienda encarecidamente abordar esto, ya que esto conduce a vistas de topología incompletas de la base instalada y a que no se esté al tanto de los síntomas conocidos.
Si bien la sincronización del nodo es la solución, la mejor recomendación es actualizar xDoctor en todos los nodos a la versión más reciente para todos los detectores de síntomas y correcciones automáticas habilitados. Los curadores automáticos se introdujeron en versiones posteriores de xDoctor.
Tenga en cuenta que al descargar el paquete xDoctor, esto depende de la versión de código en ECS y OBS. También tome nota de los siguientes formatos de archivo:
- ECS (3.8 y versiones anteriores): el paquete de xDoctor comienza con 4.x. (Por ejemplo: 4.8-105.0): página web de soporte de productos de ECS (es necesario iniciar sesión para descargar el paquete)
- OBS (3.9 y superior): el paquete xDoctor comienza con 5.x (Ejemplo: 5.1-105.0) - Página web de soporte de productos OBS (es necesario iniciar sesión para descargar el paquete)
|
Para actualizar xDoctor a la versión más reciente, siga los pasos que se indican en la base de conocimientos ECS: OBS: xDoctor: Procedimiento de actualización manual:
Consulte el Ejemplo 1 en la sección Información adicional para actualizar xDoctor a la versión más reciente. |
|
Si hay alguna restricción con la actualización de xDoctor a la versión más reciente, podemos sincronizar la última versión en el sistema local. Siga los pasos que se indican en la base de conocimientos ECS: OBS: xDoctor: Procedimiento de actualización manual:
Consulte el Ejemplo 2 en la sección Información adicional para que todos los nodos de xDoctor sean uniformes con la última versión. |
Una vez que xDoctor se actualice a la versión más reciente, confirme que la versión de xDoctor sea uniforme en todos los nodos del rack:
# sudo xdoctor -s xDoctor Uniform on all nodes: 4.8-105.0.
Si necesita ayuda con los pasos anteriores, comuníquese con el soporte técnico de Dell y mencione esta base de conocimientos.
Additional Information
A continuación, se muestran ejemplos proporcionados según la sección de resolución:
Ejemplo 1: Actualizar xDoctor a la versión
más reciente Confirme el síntoma de que xDoctor no es uniforme en todos los nodos. Los siguientes nodos 1-5 están en xDoctor 4.8-102.0, mientras que los nodos 6-10 están en 4.8-95.0:
# sudo xdoctor -s xDoctor not uniform across all nodes ... Trying xDoctor Resync ... Resync failed: No xDoctor package found for re-installation [4.8-102.0] -> ['169.254.2.1', '169.254.2.2', '169.254.2.3', '169.254.2.4', '169.254.2.5'] [4.8-95.0] -> ['169.254.2.10', '169.254.2.11', '169.254.2.8', '169.254.2.9', '169.254.2.6', '169.254.2.7']
Una vez que se carga la versión más reciente de xDoctor en el nodo 1 a /home/admin, confirme que existe:
# ls -l /home/admin | grep xDoctor -rw-r--r-- 1 admin users 43793804 Apr 14 08:21 xDoctor4ECS-4.8-102.0.noarch.rpm -rw-r--r-- 1 root root 121382804 Oct 9 11:34 xDoctor4ECS-4.8-105.0.noarch.rpm
Actualice xDoctor a la versión más reciente y habilite todos los correctores automáticos:
# sudo xdoctor --upgrade --local=/home/admin/xDoctor4ECS-4.8-105.0.noarch.rpm
This new xDoctor RPM has the following Auto Healers:
┌──────────────┐
│ Auto Healers │
└───┬──────────┘
│
│ time_zone = Enabled
│ pmon_crontab_check = Disabled
│ pmon_swapiness_check = Disabled
│ rsyslogd_check = Disabled
│ task_md_cleanup_status = Disabled
│ ntpd_not_running (New) = Disabled
│ cron_not_running (New) = Disabled
│ machines_file_error (New) = Disabled
│ non_uniform_psnt (New) = Disabled
│ racadm_stale_pid (New) = Disabled
│ obj_control_svc_check (New) = Disabled
In order to have them active, they need to be enabled ...
You can do this during this upgrade or later post upgrade via `xdoctor --config`
Would you like to enable (A)ll, only the (N)ew ones or (I)gnore them [I]: A
2025-10-09 11:36:15,663: xDoctor_4.8-102.0 - INFO : User selected to enable all Auto Healers ...
2025-10-09 11:36:15,663: xDoctor_4.8-102.0 - INFO : Local Upgrade (/home/admin/xDoctor4ECS-4.8-105.0.noarch.rpm)
2025-10-09 11:36:15,696: xDoctor_4.8-102.0 - INFO : Current Installed xDoctor version is 4.8-102.0
2025-10-09 11:36:15,712: xDoctor_4.8-102.0 - INFO : Requested package version is 4.8-105.0
2025-10-09 11:36:15,713: xDoctor_4.8-102.0 - INFO : Updating xDoctor RPM Package (RPM)
2025-10-09 11:36:15,935: xDoctor_4.8-102.0 - INFO : - Distribute package
2025-10-09 11:36:17,402: xDoctor_4.8-102.0 - INFO : - Install new rpm package
2025-10-09 11:36:33,562: xDoctor_4.8-102.0 - INFO : Enabling Auto Healer: pmon_crontab_check ...
2025-10-09 11:36:33,563: xDoctor_4.8-102.0 - INFO : Enabling Auto Healer: pmon_swapiness_check ...
2025-10-09 11:36:33,563: xDoctor_4.8-102.0 - INFO : Enabling Auto Healer: rsyslogd_check ...
2025-10-09 11:36:33,563: xDoctor_4.8-102.0 - INFO : Enabling Auto Healer: task_md_cleanup_status ...
2025-10-09 11:36:33,563: xDoctor_4.8-102.0 - INFO : Enabling Auto Healer: ntpd_not_running ...
2025-10-09 11:36:33,563: xDoctor_4.8-102.0 - INFO : Enabling Auto Healer: cron_not_running ...
2025-10-09 11:36:33,563: xDoctor_4.8-102.0 - INFO : Enabling Auto Healer: machines_file_error ...
2025-10-09 11:36:33,563: xDoctor_4.8-102.0 - INFO : Enabling Auto Healer: non_uniform_psnt ...
2025-10-09 11:36:33,563: xDoctor_4.8-102.0 - INFO : Enabling Auto Healer: racadm_stale_pid ...
2025-10-09 11:36:33,563: xDoctor_4.8-102.0 - INFO : Enabling Auto Healer: obj_control_svc_check ...
2025-10-09 11:36:33,828: xDoctor_4.8-102.0 - INFO : Auto Healer Settings saved and distributed ...
┌──────────────────────┐
│ Updated Auto Healers │
└───┬──────────────────┘
│
│ time_zone = Enabled
│ pmon_crontab_check = Enabled
│ pmon_swapiness_check = Enabled
│ rsyslogd_check = Enabled
│ task_md_cleanup_status = Enabled
│ ntpd_not_running (New) = Enabled
│ cron_not_running (New) = Enabled
│ machines_file_error (New) = Enabled
│ non_uniform_psnt (New) = Enabled
│ racadm_stale_pid (New) = Enabled
│ obj_control_svc_check (New) = Enabled
2025-10-09 11:36:33,829: xDoctor_4.8-102.0 - INFO : xDoctor successfully updated to version 4.8-105.0
Confirme que xDoctor ahora sea uniforme en todos los nodos:
# sudo xdoctor -s xDoctor Uniform on all nodes: 4.8-105.0
Ejemplo 2: haga que todos los nodos de xDoctor sean uniformes a la última versión en el sistema local.
Confirme el síntoma de que xDoctor no es uniforme en todos los nodos: los siguientes nodos 1, 2 y 4 están en xDoctor 4.8-100.1, mientras que los nodos 3 están en 4.8-85.0:
# sudo xdoctor -s xDoctor not uniform across all nodes ... Trying xDoctor Resync ... Resync failed: No xDoctor package found for re-installation [4.8-85.0] -> ['169.254.1.3'] [4.8-100.1] -> ['169.254.1.4', '169.254.1.2', '169.254.1.1']
En los nodos 1 (preferiblemente), 2 o 4, confirme que el paquete xDoctor 4.8-100.1 exista en /home/admin:
# ls -l /home/admin | grep xDoctor -rw-r--r-- 1 admin users 43793804 Mar 4 08:21 xDoctor4ECS-4.8-99.0.noarch.rpm -rw-r--r-- 1 root root 121382804 Sep 2 11:34 xDoctor4ECS-4.8-100.1.noarch.rpm
Reinstale el paquete de xDoctor:
sudo xdoctor --upgrade --local=/home/admin/xDoctor4ECS-4.8-100.1.noarch.rpm --reinstall 2025-10-09 12:24:19,996: xDoctor_4.8-100.1 - INFO : Local Upgrade (/home/admin/xDoctor4ECS-4.8-100.1.noarch.rpm) 2025-10-09 12:24:20,029: xDoctor_4.8-100.1 - INFO : Current Installed xDoctor version is 4.8-100.1 2025-10-09 12:24:20,046: xDoctor_4.8-100.1 - INFO : Requested package version is 4.8-100.1 2025-10-09 12:24:20,046: xDoctor_4.8-100.1 - WARNING : (Re)installing requested xDoctor package ... 2025-10-09 12:24:20,046: xDoctor_4.8-100.1 - INFO : Updating xDoctor RPM Package (RPM) 2025-10-09 12:24:20,176: xDoctor_4.8-100.1 - INFO : - Distribute package 2025-10-09 12:24:21,745: xDoctor_4.8-100.1 - INFO : - Install new rpm package 2025-10-09 12:24:37,095: xDoctor_4.8-100.1 - INFO : xDoctor successfully updated to version 4.8-100.1
Confirme que xDoctor ahora sea uniforme en todos los nodos:
sudo -i xdoctor -s xDoctor Uniform on all nodes: 4.8-100.1