ECS: xDoctor: RAP081: Symptomkod: 2048: Alla NTP-servrar är INTE lämpliga för synkronisering
Summary: xDoctor upptäckte ett problem med Network Time Protocol (NTP) daemon.
Symptoms
Alla noder i ett ECS-rack ska ha NTP-daemonen igång och de konfigurerade NTP-servrarna ska kunna synkronisera tiden. Om inte, kan detta leda till problem med inmatning av frontend-data.
| Symptom |
Meddelande |
|---|---|
| NTP_NOT_SUITABLE_ERROR |
Meddelande = Alla NTP-servrar är INTE lämpliga för synkronisering. |
Cause
Ovanstående symtom kvarstår som en VARNING om det inte inträffar inom 24 timmar.
Efter 24 timmar, om detta kvarstår, kommer allvarlighetsgraden att ökas till ett FEL och en RAP081 rapporteras.
Resolution
Detta innebär att på varje nod som anges i fältet "Extra" kan inte synkroniseras med NTP-servern.
Verifiering:
1. Hämta listan med NTP-servrar på var och en av noderna i listan:
Kommando:
# getrackinfo -r | grep NTP
Exempel:
admin@node1:~> getrackinfo -r | grep NTP
NTPServer = xxx.xxx.xxx.xxx
2. För varje NTP-server som anges i steg 1 testar du om den kan synkronisera tiden.
Kommando:
# sudo ntpdate -p 2 -d <NTP IP-adress / NTP FQDN>
Eller
# sudo ntpdate -p 2 -d 'getrackinfo -r | grep NTP |grep -oP "(?:[0-9]{1,3}\.) {3} [0-9] {1,3}"'
Exempel (kan synkronisera tiden):
admin@node1:~> sudo ntpdate -p 2 -d xxx.xxx.xxx.xxx
22 Feb 13:47:48 ntpdate[110901]: ntpdate 4.2.8p11@1.3728-o Thu Jun 14 09:26:52 UTC 2018 (1)
Looking for host <NTP IP Address> and service ntp<
NTP IP Address> reversed to <NTP hostname>
host found : <NTP-värdnamnssändning(NTP IP-adress>)
receive(<NTP IP-adress)
sänd(NTP IP-adress>)
receive(<<NTP IP-adress>>)
<server NTP IP-adress>, port 123
stratum 2, precision -24, leap 00, trust 000
refid [<NTP IP-adress>], fördröjning 0,02615, spridning 0,00003
överförd 2, i filter 2
referenstid:<>
e01a7b0d.af9e6616 Fri, Feb 22 2019 13:43:41.686
Originate Timestamp: E01A7C06.748E0C65 Fri, Feb 22 2019 13:47:50.455
Sänd tidsstämpel: e01a7c06.7478b000 Fri, Feb 22 2019 13:47:50.454
Filterfördröjning: 0,02635 0,02615 0,00000 0,00000
0,00000 0,00000 0,00000 0,00000
Filterförskjutning: 0,000043 -0,00002 0,000000 0,000000
0,000000 0,000000 0,000000 0,000000
fördröjning 0,02615, spridning 0,00003
offset -0,000022
22 Feb 13:47:50 ntpdate[110901]: justera tidsserverns <NTP IP-adressförskjutning> -0,000022 sek
Exempel: (om den inte kan synkronisera tid visas följande utdata)
admin@node1:~> sudo ntpdate -p 2 -d xxx.xxx.xxx.xxx
22 Feb 13:47:48 ntpdate[110901]: ntpdate 4.2.8p11@1.3728-o Thu Jun 14 09:26:52 UTC 2018 (1)
Looking for host <NTP IP Address> and service ntp<
NTP IP Address> reversed to <NTP hostname>
host found : <NTP-värdnamnssändning>
(<NTP IP-adress>)
sänd<(NTP IP-adress)
sändning(NTP IP-adress>>)server< NTP IP-adress>, port 123
stratum 2, precision -24, språng 00, trust 000
refid [<NTP IP-adress>], fördröjning 0,02615, spridning 0,00003
överförd 2, i filter 2
referenstid:<
e01a7b0d.af9e6616 Fri, Feb 22 2019 13:43:41.686
Originate Timestamp: E01A7C06.748E0C65 Fri, Feb 22 2019 13:47:50.455
Sänd tidsstämpel: e01a7c06.7478b000 Fri, Feb 22 2019 13:47:50.454
Filterfördröjning: 0,02635 0,02615 0,00000 0,00000
0,00000 0,00000 0,00000 0,00000
Filterförskjutning: 0,000043 -0,00002 0,000000 0,000000
0,000000 0,000000 0,000000 0,000000
fördröjning 0,02615, spridning 0,00003
offset -0,000022
22 Feb 13:47:50 ntpdate[112232]: ingen server lämplig för synkronisering hittades
3. Lägg till FQDN i NTP-avsnittet i getrackinfo -r resultatet.
Kommando:
# sudo setrackinfo -a NTPServer < NTP FQDN >
4. Kontrollera om det finns nätverksseparation och statiska vägar, eftersom NTP som skickas från hanteringsgränssnittet via policybaserad routning kan orsaka problemet.
Kommando:
# getrackinfo -n; getrackinfo -t
Exempel:
admin@node1:~>getrackinfo -n; getrackinfo -t
Namngivna nätverk
==============nod-ID Nätverkets
IP-adress Netmask Gateway VLAN-gränssnitt
Statisk routningslista
=================
nod-ID Nätverk Netmask Gateway-gränssnitt
5. Kontrollera om NTP-servrarna lyssnar i sin miljö och det finns ofta en brandvägg som blockerar porten.
Kommando:
# sudo ntpq -c som
Exempel: (Nedan ser vi en NTP-server som inte kan nås och den andra blockeras, troligen på grund av en ACL)
admin@node1:~> sudo ntpq -c as
ind assid status conf reach auth condition last_event cnt
===========================================================
1 56633 8011 ja nej ingen avvisa mobilisera 1
6. Kontrollera om det finns någon datumavvikelse i NTP.
Kommando:
# viprexec "date +%s" 2>&1 | grep "^15"
Exempel:
admin@node1:~>viprexec "date +%s" 2>&1 | grep "^15"
1554470147
1554470111
1554470096
1554470142 1554470144
1554470109
1554470124
1554470140
7. Kontrollera status för ntpd-tjänsten och starta sedan om tjänsten. (Även om statusen är igång fortsätter du med omstarten.)
Obs! Ntpd-tjänsten är en tjänst som inte har någon påverkan.
Kommando:
# viprexec systemctl status ntpd.service | grep Active:
Exempel:
admin@node1:~> viprexec systemctl status ntpd.service | grep Aktiva:
Aktiv: aktiv (körs) sedan Tue 2019-08-06 02:49:06 UTC; 1 dag 18h sedan
Aktiv: aktiv (körs) sedan Tue 2019-08-06 02:49:07 UTC; 1 dag 18h sedan
Aktiv: aktiv (körs) sedan ons 2019-08-07 20:13:27 UTC; 58min sedan
Aktiv: aktiv (körs) sedan Tue 2019-08-06 02:49:06 UTC; 1 dag 18h sedan
Aktiv: aktiv (körs) sedan Tue 2019-08-06 02:49:07 UTC; 1 dag 18h sedan
Aktiv: aktiv (körs) sedan Tue 2019-08-06 02:49:07 UTC; 1 dag 18h sedan
Aktiva: aktiv (körs) sedan Tue 2019-08-06 02:49:07 UTC; 1 dag 18h sedan
Aktiv: aktiv (körs) sedan Tue 2019-08-06 02:49:07 UTC; 1 dag 18h sedan
Kommando:
# viprexec systemctl starta om ntpd.service
Exempel:
admin@node1:~> viprexec systemctl omstart ntpd.service
Utdata från värd: 192.168.219.8
Utdata från värd: 192.168.219.7
Utdata från värd: 192.168.219.6
Utdata från värd: 192.168.219.4
Utdata från värd: 192.168.219.3
Utdata från värd: 192.168.219.2
Utdata från värd: 192.168.219.5
Utdata från värd: 192.168.219.1
8. Kontrollera md5sum ntp.conf-filen på alla noder.
Kommando:
# viprexec "sudo md5sum /etc/ntp.conf"
Exempel:
admin@node1:~> viprexec "sudo md5sum /etc/ntp.conf"
Utdata från värd: 192.168.219.2
741f0abb12ac82a21f150004bd407334 /etc/ntp.conf
Utdata från värd: 192.168.219.5
741f0abb12ac82a21f150004bd407334 /etc/ntp.conf
Utdata från värd: 192.168.219.4
741f0abb12ac82a21f150004bd407334 /etc/ntp.conf
Utdata från värd: 192.168.219.1
7da6eb8009abc18ed1875f1f15ade72a /etc/ntp.conf
Utdata från värd: 192.168.219.3
741f0abb12ac82a21f150004bd407334 /etc/ntp.conf
Utdata från värd: 192.168.219.8
741f0abb12ac82a21f150004bd407334 /etc/ntp.conf
Utdata från värd: 192.168.219.6
741f0abb12ac82a21f150004bd407334 /etc/ntp.conf
Utdata från värd: 192.168.219.7
741f0abb12ac82a21f150004bd407334 /etc/ntp.conf
Obs! Detta kan bero på att du har ett offentligt gränssnitt och hanteringsgränssnitt och att noderna alla är konfigurerade för att bli offentliga enligt den senaste konfigurationen. I äldre versioner av ECS kan PBR fastna där en nod är giltig och resten av noderna verkar vara bakom en brandvägg.
9. Lägg till 123 i ns_mgmt i getrackinfo -r-resultatet och kontrollera sedan om NTP har börjat sända och ta emot.
Kommando:
# sudo setrackinfo -en ns_mgmt 123
Exempel:
admin@node1:~>sudo setrackinfo -en ns_mgmt 123
Om felet fortfarande kvarstår, placerar du port 123 tillbaka i det offentliga gränssnittet och söker efter synkroniseringen igen.
Kommando:
# sudo setrackinfo-d ns_mgmt 123
Exempel:
admin@node1:~> sudo setrackinfo -d ns_mgmt 123
Kontrollera status för NTP-synkroniseringen när du har utfört vart och ett av stegen ovan.
Resolution:
Det innebär att servern som den är konfigurerad inte är en NTP-server eller att den inte fungerar som förväntat. Kundens nätverksteam måste engageras för att lösa NTP-problemet.
Additional Information
För symptomet "NTP-demonen körs inte" (NTPD_NOT_RUNNING), se kunskapsartikel:
ECS: xDoctor: RAP081: Symptomkod: 2048: NTP-daemonen körs
inteFör symptomet "Alla NTP-servrar justerar en förskjutning som är högre än feltröskeln" (NTP_ERROR_OFFSET_ERROR), se kunskapsartikel:
ECS: xDoctor: RAP081: Symptomkod: 2048: Alla NTP-servrar justerar en förskjutning som är högre än feltröskeln
För symptomet "Systemtidsskillnad över FELTRÖSKELN", se kunskapsartikel:
ECS: xDoctor: RAP081: Symptomkod: 2048: Systemets tidsskillnad över FELTRÖSKELN