VxRail: Jak odstraňovat problémy s protokolem NTP v clusteru VxRail
Summary: Odstraňování problémů s protokolem NTP (Network Time Protocol).
Instructions
/etc/ntp.conf přímo. Informace o konfiguraci protokolu NTP na hostitelích naleznete v tématech: https://knowledge.broadcom.com/external/article/313808
Pomocí ntpq Kontrola stavu synchronizace z nástroje VxRail Manager:
vrm:~ # ntpq -c assoc ind assid status conf reach auth condition last_event cnt =========================================================== 1 3898 961a yes yes none sys.peer sys_peer 1
Poznámka: Pokud NTP funguje dobře, výsledek by měl být reach=yes, condition=sys.peer.
ntpq> rv 3898 associd=3898 status=961a conf, reach, sel_sys.peer, 1 event, sys_peer, srcadr=10.XX.1XX.1X0, srcport=123, dstadr=10.XX.1XX.1X1, dstport=123, leap=00, stratum=12, precision=-6, rootdelay=31.250, rootdisp=64.575, refid=10.62.68.236, reftime=e0d00ab8.2af01902 Wed, Jul 10 2019 6:56:56.167, rec=e0d00c5e.d78d706e Wed, Jul 10 2019 7:03:58.842, reach=377,
Pokud dosah není Ano a podmínka není sys.peer (což znamená, že dochází k problému se synchronizací času), zkontrolujte místní čas a čas serveru NTP. Pokud je místní čas větší nebo kratší než 1000 sekund, ntpd nenastaví hodiny. Čas je nutné nastavit ručně.
Následující stav zobrazuje abnormální stav synchronizace:
vrm:~ # ntpq -c assoc ind assid status conf reach auth condition last_event cnt =========================================================== 1 58280 8011 yes no none reject mobilize 1
Skript reach=no znamená, že server NTP nereaguje na požadavek nebo je síť nedostupná. Odstraňte problémy se sítí a serverem NTP.
Scénář 1: Problém se sítí:
Pomocí příkazu ping zkontrolujte, zda je server NTP dostupný, a postupujte podle pokynů pro odstraňování problémů se sítí. Po potvrzení problému se sítí požádejte uživatele, aby se zapojil do síťového týmu a potvrdil, že problém se sítí je vyřešen.
Scénář 2: Chybná IP adresa NTP nebo problém se službou:
Pokud lze na server NTP odeslat příkaz ping, může uživatel zadávat nesprávnou IP adresu NTP nebo dojde k problému se službou NTP. Ověřte s uživatelem, že IP adresa NTP je správná, nebo použijte jiný server NTP, pokud jej uživatel má a požádal jej, aby do kontroly zapojil tým správců. Někdy může problém vyřešit restart serveru, takže můžeme zkusit tuto cestu, pokud je to pro uživatele přijatelné.
Scénář 3: Windows NTP server:
Služba Systémový čas implementuje neplnohodnotný protokol NTP. Pokud uživatel používá Windows Server jako server NTP, rootdisp může být vyšší než 1000. V takovém případě nakonfigurujte Windows NTP Server tak, aby synchronizoval spolehlivý externí server NTP.
V případě, že se reach=yesAle condition=rejectpoužívat ntpq s assoc a rv Chcete-li zkontrolovat flash code, dispersiona rootdisp.
vrm:~ # ntpq -c assoc ind assid status conf reach auth condition last_event cnt =========================================================== 1 3898 9014 yes yes none reject reachable 1
Poznámka: Skript assoc může zobrazit assid které jsou potřebné pro rv později.
Pomocí tlačítek rv příkaz k získání flash code, dispersiona rootdisp.
Spusťte ntpq příkaz pro zadání ntpq shell, pak použijte rv assid a získejte podrobné informace.
ntpq ntpq> rv 3898 associd=3898 status=9014 conf, reach, sel_reject, 1 event, reachable, srcadr=10.XX.1XX.1X0, srcport=123, dstadr=10.XX.1XX.1X1, dstport=123, leap=00, stratum=12, precision=-6, rootdelay=31.250, rootdisp=1814.209, refid=10.XX.XX.2X6, reftime=e0cff348.12fb407d Wed, Jul 10 2019 5:16:56.074, rec=e0cff42b.60680b73 Wed, Jul 10 2019 5:20:43.376, reach=377, unreach=0, hmode=3, pmode=4, hpoll=6, ppoll=6, headway=50, flash=400 peer_dist, keyid=0, offset=-2536.264, delay=0.354, dispersion=16.515, jitter=4.414, xleave=0.038, filtdelay= 0.35 0.29 0.32 0.26 0.28 3.22 0.28 0.35, filtoffset= -2536.2 -2538.2 -2529.4 -2536.2 -2541.6 -2530.0 -2532.5 -2538.1, filtdisp= 15.63 16.63 17.59 18.55 19.53 20.53 21.52 22.50 flash=400 peer_dist #reject reason dispersion=16.515 #it presents the error/variance between that NTP server and client rootdisp=1814.209 #it presents the total amount of error/variance from the root NTP server to client
flash=400 peer_dist označuje, že vzdálenost ke kořenovému serveru NTP je příliš velká. Není vhodné synchronizovat.
Další informace o flash kódu naleznete na následujícím odkazu:
https://www.eecis.udel.edu/~mills/ntp/html/decode.html#flashObecně dispersion vyšší než 1000 je považován za nevhodný server NTP. Pokud je systém Windows NTP Server nakonfigurován tak, aby synchronizoval čas sám se sebou, nebo parametry nejsou správně nakonfigurovány, rootdisp je vyšší než 1000 a je nutné opravit konfiguraci protokolu NTP v systému Windows Server.
Informace o konfiguraci časového serveru systému Windows naleznete v následujícím článku znalostní databáze Microsoft.
https://support.microsoft.com/en-us/help/816042/how-to-configure-an-authoritative-time-server-in-windows-serverPoznámka: Změnit MaxPosPhaseCorrection, MaxNegPhaseCorrection a SpecialPollInterval až 300 sekund
Scénář 4: Nestabilní síť mezi serverem NTP a externím serverem NTP:
Zkontrolujte síť podle pokynů pro odstraňování problémů se sítí, pomocí příkazu ping lze zkontrolovat, zda existuje vysoká latence.