VxRail: Come risolvere i problemi NTP in un cluster VxRail
Summary: Come risolvere i problemi NTP (Network Time Protocol).
Instructions
/etc/ntp.conf direttamente. Per configurare NTP sugli host, vedere: https://knowledge.broadcom.com/external/article/313808
Utilizzare ntpq Per controllare lo stato della sincronizzazione da VxRail Manager:
vrm:~ # ntpq -c assoc ind assid status conf reach auth condition last_event cnt =========================================================== 1 3898 961a yes yes none sys.peer sys_peer 1
Nota: Se NTP funziona correttamente, il risultato dovrebbe essere reach=yes, condition=sys.peer.
ntpq> rv 3898 associd=3898 status=961a conf, reach, sel_sys.peer, 1 event, sys_peer, srcadr=10.XX.1XX.1X0, srcport=123, dstadr=10.XX.1XX.1X1, dstport=123, leap=00, stratum=12, precision=-6, rootdelay=31.250, rootdisp=64.575, refid=10.62.68.236, reftime=e0d00ab8.2af01902 Wed, Jul 10 2019 6:56:56.167, rec=e0d00c5e.d78d706e Wed, Jul 10 2019 7:03:58.842, reach=377,
Se reach non è yes e la condizione non è sys.peer (il che significa che la sincronizzazione dell'ora ha problemi), controllare l'ora locale e l'ora del server NTP. Se l'ora locale è maggiore o inferiore a 1000 secondi, ntpd non imposterà l'orologio. L'ora deve essere impostata manualmente.
Lo stato di sincronizzazione anomalo è mostrato nel seguente stato:
vrm:~ # ntpq -c assoc ind assid status conf reach auth condition last_event cnt =========================================================== 1 58280 8011 yes no none reject mobilize 1
La colonna reach=no significa che il server NTP non risponde alla richiesta o la rete non è disponibile. Risolvere i problemi della rete e del server NTP.
Scenario 1: Problema di rete:
Utilizzare il ping per verificare se il server NTP è raggiungibile e seguire la risoluzione dei problemi di rete per verificare. Una volta confermato il problema di rete, chiedere all'utente di contattare il team di rete e confermare che il problema di rete è stato risolto.
Scenario 2: IP NTP o problema di servizio errati:
Se è possibile eseguire il ping del server NTP, è possibile che l'utente immetta l'IP NTP errato o che si verifichi un problema nel servizio NTP. Verificare con l'utente che l'indirizzo IP NTP sia corretto o utilizzare un altro server NTP se l'utente ne ha uno e chiede all'utente di coinvolgere il proprio team di amministrazione per controllare. A volte il riavvio del server può risolvere il problema, quindi possiamo provare quella strada, se accettabile per l'utente.
Scenario 3: Server NTP Windows:
Il servizio Ora di Windows implementa un NTP non completo. Se l'utente utilizza un Windows Server come server NTP, l'opzione rootdisp può essere superiore a 1000. In tal caso, configurare Windows NTP Server per sincronizzare un server NTP esterno affidabile.
Se reach=yesma condition=rejectusare ntpq a assoc e rv Per controllare il flash code, dispersione rootdisp.
vrm:~ # ntpq -c assoc ind assid status conf reach auth condition last_event cnt =========================================================== 1 3898 9014 yes yes none reject reachable 1
Nota: La colonna assoc l'opzione può mostrare l'opzione assid che è necessario per rv Dopo.
Utilizzare il comando rv comando per ottenere il flash code, dispersione rootdisp.
Eseguire il comando ntpq comando per immettere il ntpq shell, quindi utilizzare rv assid per ottenere le informazioni dettagliate.
ntpq ntpq> rv 3898 associd=3898 status=9014 conf, reach, sel_reject, 1 event, reachable, srcadr=10.XX.1XX.1X0, srcport=123, dstadr=10.XX.1XX.1X1, dstport=123, leap=00, stratum=12, precision=-6, rootdelay=31.250, rootdisp=1814.209, refid=10.XX.XX.2X6, reftime=e0cff348.12fb407d Wed, Jul 10 2019 5:16:56.074, rec=e0cff42b.60680b73 Wed, Jul 10 2019 5:20:43.376, reach=377, unreach=0, hmode=3, pmode=4, hpoll=6, ppoll=6, headway=50, flash=400 peer_dist, keyid=0, offset=-2536.264, delay=0.354, dispersion=16.515, jitter=4.414, xleave=0.038, filtdelay= 0.35 0.29 0.32 0.26 0.28 3.22 0.28 0.35, filtoffset= -2536.2 -2538.2 -2529.4 -2536.2 -2541.6 -2530.0 -2532.5 -2538.1, filtdisp= 15.63 16.63 17.59 18.55 19.53 20.53 21.52 22.50 flash=400 peer_dist #reject reason dispersion=16.515 #it presents the error/variance between that NTP server and client rootdisp=1814.209 #it presents the total amount of error/variance from the root NTP server to client
flash=400 peer_dist indica che la distanza dal server NTP root è troppo lunga. Non è possibile eseguire la sincronizzazione.
Per ulteriori informazioni sul codice flash, consultare il seguente link:
https://www.eecis.udel.edu/~mills/ntp/html/decode.html#flashGeneralmente dispersion un valore superiore a 1000 è considerato server NTP non idoneo. Se il server NTP di Windows è configurato per sincronizzare l'ora con se stesso o i parametri non sono configurati correttamente, il rootdisp è superiore a 1000 e la configurazione NTP in Windows Server deve essere corretta.
Per configurare il server di riferimento ora di Windows, consultare il seguente articolo della Knowledge Base di Microsoft.
https://support.microsoft.com/en-us/help/816042/how-to-configure-an-authoritative-time-server-in-windows-serverNota: Cambiare MaxPosPhaseCorrection, MaxNegPhaseCorrection e SpecialPollInterval fino a 300 secondi
Scenario 4: Rete instabile tra il server NTP e il server NTP esterno:
Seguire la risoluzione dei problemi di rete per controllare la rete. È possibile utilizzare il ping per verificare se è presente una latenza elevata.