ECS: xDoctor: RAP081: Symptom Code: 2048: NTP-Daemon wird nicht ausgeführt

Zusammenfassung: xDoctor hat ein Problem mit dem Network Time Protocol (NTP)-Daemon erkannt.

Dieser Artikel gilt für Dieser Artikel gilt nicht für Dieser Artikel ist nicht an ein bestimmtes Produkt gebunden. In diesem Artikel werden nicht alle Produktversionen aufgeführt.

Symptome

Auf allen Nodes in einem ECS-Rack sollte der NTP-Daemon ausgeführt werden und die konfigurierten NTP-Server sollten in der Lage sein, die Zeit zu synchronisieren. Andernfalls kann dies zu Problemen bei der Front-end-Datenaufnahme führen. Die Best Practices für NTP besagen, dass mindestens vier und höchstens sieben NTP-Server verwendet werden sollten.

Symptom

Meldung

 NTPD_NOT_RUNNING

Meldung = NTP-Daemon wird nicht ausgeführt
Extra = [Liste der Nodes]

Diese Symptome bedeuten, dass ntpd nicht auf jedem Node ausgeführt wird, der im Feld "Extra" aufgeführt ist.

Ursache

Das obige Symptom bleibt als WARNUNG für 24 Stunden bestehen, wenn das Problem innerhalb dieser Zeit nicht erneut auftritt. Wenn das Problem nach 24 Stunden weiterhin besteht, wird der Schweregrad auf FEHLER erhöht und RAP081 wird gemeldet.

Lösung

WICHTIG! Eine neue Funktion wurde in xDoctor 4-8.104.0 und späteren Versionen veröffentlicht. Diese Wissensdatenbank (KB) ist jetzt mit xDoctor automatisiert und löst die meisten unten aufgeführten Probleme, ohne dass L2 oder Coach einbezogen werden müssen.

 

WICHTIG! Diese Lösung automatisiert den Neustart von ntpd auf allen Nodes, auf denen es nicht ausgeführt wird, und führt mehrere Abfragen der konfigurierten NTP-Server der Kunden aus. Kunden sollten über diese erwarteten Verhaltensweisen informiert werden, bevor sie die Automatisierung ausführen.

Befolgen Sie ECS, um das Automation Repository mit xDoctor 4-8.104.0 und höheren Versionen einzurichten: ObjectScale: So führen Sie KB-Automatisierungsskripte (Autopilot) aus.
  1. Führen Sie den Automatisierungsbefehl von einem Rack-Steuerungs-Node mit xDoctor 4-8.104.0 oder höher aus.
Befehl:
Nur --target-rack wird für diese Aktion unterstützt. Dieses Skript war in der xDoctor-Version 4-8.104.0 enthalten, die Version 3.0.0 der Ansible-Automatisierungsskripte enthält.
# sudo xdoctor autopilot --kb 64221 --target-rack red
Beispiel:
admin@ecs-n1:~> sudo xdoctor autopilot --kb 64221 --target-rack red
Checking for existing screen sessions...
Starting screen session 'autopilot_kb_64221_20250630_162310'...
Screen session 'autopilot_kb_64221_20250630_162310' started successfully.
Attaching to screen session 'autopilot_kb_64221_20250630_162310'...

2. Die Automatisierung kann einige Minuten dauern. Die Automatisierung meldet möglicherweise vorübergehende "Ausfälle" in der fortlaufenden Ausgabe, die sicher ignoriert werden können.

3. Die endgültige Zusammenfassung enthält relevante Statusinformationen, Neustarts oder Änderungen, die im Rahmen der Automatisierung aufgetreten sind. Es enthält auch Empfehlungen für bekannte Zustände.

Sauberes Beispiel:

TASK [Summary Dump] *****************************************************************************************************************************************************************************************************************
ok: [169.254.1.1] => {
    "formatted_summary": [
        "| ========================== NTP SUMMARY =============================                                         |",
        "|                                                                                                              |",
        "| NTP addresses: 10.174.xxx.52 10.18.yyy.52 10.104.zz.52 10.34.ww.52                                           |",
        "| Management Network Separation: False                                                                         |",
        "| NTP checks results:                                                                                          |",
        "| -  No issue with 10.174.xxx.52                                                                               |",
        "| -  No issue with 10.18.yyy.52                                                                                |",
        "| -  No issue with 10.104.zz.52                                                                                |",
        "| -  No issue with 10.34.ww.52                                                                                 |",
        "| General system time: 1751300610 (epoch): Mon Jun 30 16:23:30 UTC 2025                                        |",
        "|                                                                                                              |",
        "| Current Times:                                                                                               |",
        "|   169.254.1.1-->   date: 06/30/25 16:23:34   hwClock: 06/30/25 16:23:34                                      |",
        "|   169.254.1.2-->   date: 06/30/25 16:23:34   hwClock: 06/30/25 16:23:34                                      |",
        "|   169.254.1.3-->   date: 06/30/25 16:23:34   hwClock: 06/30/25 16:23:34                                      |",
        "|   169.254.1.4-->   date: 06/30/25 16:23:34   hwClock: 06/30/25 16:23:34                                      |",
        "|   169.254.1.5-->   date: 06/30/25 16:23:34   hwClock: 06/30/25 16:23:34                                      |"
    ]
}

PLAY RECAP **************************************************************************************************************************************************************************************************************************
169.254.1.1                : ok=66   changed=12   unreachable=0    failed=0    skipped=64   rescued=1    ignored=1
169.254.1.2                : ok=34   changed=8    unreachable=0    failed=0    skipped=35   rescued=1    ignored=0
169.254.1.3                : ok=34   changed=8    unreachable=0    failed=0    skipped=35   rescued=1    ignored=0
169.254.1.4                : ok=34   changed=8    unreachable=0    failed=0    skipped=35   rescued=1    ignored=0
169.254.1.5                : ok=34   changed=8    unreachable=0    failed=0    skipped=35   rescued=1    ignored=0

=====================================================================================================================================================================================================================================
Status: PASS
Time Elapsed: 0h 0m 24s
Debug log: /tmp/autopilot/log/autopilot_64221_20250630_162310.log
Message: SysTime Collected: 1751300610 ; OS date (epoch): 1751300610 ; hwclock (epoch): 1751300610
=====================================================================================================================================================================================================================================


Beispiel für einen Neustart:

TASK [Summary Dump] *********************************************************************************************************************************************************************
ok: [169.254.1.7] => {
    "formatted_summary": [
        "| ========================== NTP SUMMARY =============================                                         |",
        "|                                                                                                              |",
        "| NTP addresses: 10.xxx.yyy.52 10.xx.yy.52                                                                    |",
        "| Management Network Separation: False                                                                         |",
        "| General system time: 1731540353 (epoch)                                                                      |",
        "| ntpd was restarted on 169.254.1.1                                                                            |",
        "| Node: 169.254.1.1 | AssID: 11417 | NTP Addr: 10.xx.yy.52 | Status Code: 9014 |                              |",
        "| ntpd was restarted on 169.254.1.2                                                                            |",
        "| Node: 169.254.1.2 | AssID: 35745 | NTP Addr: 10.xx.yy.52 | Status Code: 9014 |                              |",
        "| ntpd was restarted on 169.254.1.4                                                                            |",
        "| Node: 169.254.1.4 | AssID: 19898 | NTP Addr: 10.xx.yy.52 | Status Code: 9014 |                              |",
        "|                                                                                                              |",
        "|  == RECOMMENDATIONS KEY ==                                                                                   |",
        "| Network Issue:        Have customer check routes (ipv4+ipv6) to the NTP through all fw, switches, and VLANs  |",
        "| Auth Issue:           Authentication should not be required.  Customer will need to resolve                  |",
        "| Config Issue:         Consult with SWARM / CE                                                                |",
        "| Mgmt Route Missing:   Reset mgmt separation from setrackinfo OR consult SWARM                                |",
        "| Port 123 on ns_mgmt:  Confirm with customer that port config is intended                                     |",
        "| SUGGESTION:           If any NTP is unsuitable and can be safely removed/replcaced, follow kb 19614          |"
    ]
}

Nach einem ntpd-Neustart verbleiben möglicherweise einer oder mehrere der NTP-Server im Status "abgelehnt", während die Peer-Zuordnungen von NTP festgelegt werden.
Wenn Fehler oder Bedingungen in der Zusammenfassung gemeldet werden oder Symptome auftreten, die einer zusätzlichen Erklärung bedürfen, wenden Sie sich an den ECS- und OBS-Support, um bei der Untersuchung zu helfen.

 

Manuelle Schritte zur Identifizierung und Behebung von ntpd-Services, die nicht auf Nodes ausgeführt werden:

Verifizierung:

  1. Vergewissern Sie sich, dass der NTP-Dienst ausgeführt wird:

Befehl:

# sudo service ntpd status

Beispiel:

admin@ecsnode1:~> sudo service ntpd status
* ntpd.service - NTP Server Daemon
   Loaded: loaded (/usr/lib/systemd/system/ntpd.service; enabled; vendor preset: disabled)
  Drop-In: /run/systemd/generator/ntpd.service.d
           `-50-insserv.conf-$time.conf
   Active: inactive (dead) since Wed 2019-08-07 20:00:00 UTC; 3s ago
     Docs: man:ntpd(1)
 Main PID: 63810 (code=exited, status=0/SUCCESS)
Aug 07 19:25:49 ecsnode1.gslabs.lab.emc.com sntp[63803]: 2019-08-07 19:25:49.504908 (+0000) -0.00017 +/- 0.051426 10.73.242.40 s2 no-leap
Aug 07 19:25:49 ecsnode1.gslabs.lab.emc.com start-ntpd[63780]: Time synchronized with 10.73.242.40
Aug 07 19:25:50 ecsnode1.gslabs.lab.emc.com ntpd[63809]: ntpd 4.2.8p12@1.3728-o Wed Oct 17 16:05:35 UTC 2018 (1): Starting
Aug 07 19:25:50 ecsnode1.gslabs.lab.emc.com ntpd[63809]: Command line: /usr/sbin/ntpd -p /var/run/ntp/ntpd.pid -x -g -u ntp:ntp -c /etc/ntp.conf
Aug 07 19:25:50 ecsnode1.gslabs.lab.emc.com ntpd[63810]: proto: precision = 0.089 usec (-23)
Aug 07 19:25:50 ecsnode1.gslabs.lab.emc.com ntpd[63810]: switching logging to file /var/log/ntp
Aug 07 19:25:50 ecsnode1.gslabs.lab.emc.com start-ntpd[63780]: Starting network time protocol daemon (NTPD)
Aug 07 19:25:50 ecsnode1.gslabs.lab.emc.com systemd[1]: Started NTP Server Daemon.
Aug 07 20:00:00 ecsnode1.gslabs.lab.emc.com systemd[1]: Stopping NTP Server Daemon...
Aug 07 20:00:00 ecsnode1.gslabs.lab.emc.com systemd[1]: Stopped NTP Server Daemon

 

  1. Überprüfen Sie, ob die Prozesskennung (PID) für NTP vorhanden ist oder fehlt:

Befehl:

# sudo service ntpd status;ps ax | grep ntpd | grep -v grep

Beispiel (PID fehlt):

admin@node1:~> ps ax | grep ntpd | grep -v grep
admin@node1:~>


Lösung:

  1. Wenn ntpd nicht ausgeführt wird, muss der Dienst (neu) gestartet werden:

Befehl:

# sudo service ntpd restart

Beispiel:

admin@node1:~>  sudo service ntpd restart
admin@node1:~>

 

  1. Vergewissern Sie sich, dass der Service ausgeführt wird und die PID auf dem ECS vorhanden ist.

Befehl

# sudo service ntpd status;ps ax | grep ntpd | grep -v grep

Beispiel:

admin@node1:~> sudo service ntpd status;ps ax | grep ntpd | grep -v grep
* ntpd.service - NTP Server Daemon
   Loaded: loaded (/usr/lib/systemd/system/ntpd.service; enabled; vendor preset: disabled)
  Drop-In: /run/systemd/generator/ntpd.service.d
           `-50-insserv.conf-$time.conf
   Active: active (running) since Wed 2019-08-07 20:13:27 UTC; 3min 25s ago
     Docs: man:ntpd(1)
  Process: 913 ExecStart=/usr/sbin/start-ntpd start (code=exited, status=0/SUCCESS)
 Main PID: 944 (ntpd)
    Tasks: 2 (limit: 512)
   Memory: 820.0K
      CPU: 588ms
   CGroup: /system.slice/ntpd.service
           |-944 /usr/sbin/ntpd -p /var/run/ntp/ntpd.pid -x -g -u ntp:ntp -c /etc/ntp.conf
           `-945 ntpd: asynchronous dns resolver
Aug 07 20:13:26 ecsnode1.gslabs.lab.emc.com systemd[1]: Starting NTP Server Daemon...
Aug 07 20:13:26 ecsnode1.gslabs.lab.emc.com sntp[937]: sntp 4.2.8p12@1.3728-o Wed Oct 17 16:05:30 UTC 2018 (1)
Aug 07 20:13:26 ecsnode1.gslabs.lab.emc.com sntp[937]: 2019-08-07 20:13:26.567273 (+0000) +0.00003 +/- 0.048796 10.73.242.40 s2 no-leap
Aug 07 20:13:26 ecsnode1.gslabs.lab.emc.com start-ntpd[913]: Time synchronized with 10.73.242.40
Aug 07 20:13:27 ecsnode1.gslabs.lab.emc.com ntpd[943]: ntpd 4.2.8p12@1.3728-o Wed Oct 17 16:05:35 UTC 2018 (1): Starting
Aug 07 20:13:27 ecsnode1.gslabs.lab.emc.com ntpd[943]: Command line: /usr/sbin/ntpd -p /var/run/ntp/ntpd.pid -x -g -u ntp:ntp -c /etc/ntp.conf
Aug 07 20:13:27 ecsnode1.gslabs.lab.emc.com ntpd[944]: proto: precision = 0.074 usec (-24)
Aug 07 20:13:27 ecsnode1.gslabs.lab.emc.com ntpd[944]: switching logging to file /var/log/ntp
Aug 07 20:13:27 ecsnode1.gslabs.lab.emc.com start-ntpd[913]: Starting network time protocol daemon (NTPD)
Aug 07 20:13:27 ecsnode1.gslabs.lab.emc.com systemd[1]: Started NTP Server Daemon.
   944 ?        Ss     0:00 /usr/sbin/ntpd -p /var/run/ntp/ntpd.pid -x -g -u ntp:ntp -c /etc/ntp.conf
   945 ?        S      0:00 ntpd: asynchronous dns resolver

Weitere Informationen

Wenn die obige Lösung nicht funktioniert, muss das Netzwerkteam des Kunden einbezogen werden, um das NTP-Problem zu lösen.

Informationen zum Symptom "Alle NTP-Server eignen sich NICHT für die Synchronisierung" (NTP_NOT_SUITABLE_ERROR) finden Sie im Wissensdatenbank-Artikel ECS: xDoctor: RAP081: Symptom Code: 2048: Alle NTP-Server eignen sich NICHT für die Synchronisierung.

Das Symptom "Alle NTP-Server passen einen Offset höher als den Fehlerschwellenwert an" (NTP_ERROR_OFFSET_ERROR) finden Sie im Wissensdatenbank-Artikel ECS: xDoctor: RAP081: Symptom Code: 2048: Alle NTP-Server passen einen Offset an, der höher als der Fehlerschwellenwert ist.

Informationen zum Symptom "Systemzeitdifferenz über dem FEHLERSCHWELLENWERT" finden Sie im Wissensdatenbank-Artikel ECS: xDoctor: RAP081: Symptom Code: 2048: Systemzeitdifferenz über dem FEHLERSCHWELLENWERT

ECS: ObjectScale: Ausführen von KB-Automatisierungsskripten (Autopilot)

Betroffene Produkte

Elastic Cloud Storage

Produkte

ECS Appliance Hardware Series, Elastic Cloud Storage
Artikeleigenschaften
Artikelnummer: 000064221
Artikeltyp: Solution
Zuletzt geändert: 18 Apr. 2026
Version:  13
Antworten auf Ihre Fragen erhalten Sie von anderen Dell NutzerInnen
Support Services
Prüfen Sie, ob Ihr Gerät durch Support Services abgedeckt ist.