VxRail: Cómo solucionar problemas de NTP en un clúster de VxRail
Summary: Cómo solucionar problemas de Network Time Protocol (NTP).
Instructions
/etc/ntp.conf directamente. Para configurar NTP en los hosts, consulte: https://knowledge.broadcom.com/external/article/313808
Uso ntpq Para comprobar el estado de sincronización desde VxRail Manager:
vrm:~ # ntpq -c assoc ind assid status conf reach auth condition last_event cnt =========================================================== 1 3898 961a yes yes none sys.peer sys_peer 1
Nota: Si el NTP funciona bien, el resultado debe ser reach=yes, condition=sys.peer.
ntpq> rv 3898 associd=3898 status=961a conf, reach, sel_sys.peer, 1 event, sys_peer, srcadr=10.XX.1XX.1X0, srcport=123, dstadr=10.XX.1XX.1X1, dstport=123, leap=00, stratum=12, precision=-6, rootdelay=31.250, rootdisp=64.575, refid=10.62.68.236, reftime=e0d00ab8.2af01902 Wed, Jul 10 2019 6:56:56.167, rec=e0d00c5e.d78d706e Wed, Jul 10 2019 7:03:58.842, reach=377,
Si el resultado no es yes y la condición no es sys.peer (lo que significa que la sincronización de hora tiene problemas), compruebe la hora local y la hora del servidor NTP. Si la hora local es mayor o menor que 1000 segundos, ntpd no ajustará el reloj. La hora se debe configurar manualmente.
El siguiente estado muestra el estado anormal de la sincronización:
vrm:~ # ntpq -c assoc ind assid status conf reach auth condition last_event cnt =========================================================== 1 58280 8011 yes no none reject mobilize 1
La variable reach=no significa que el servidor NTP no responde a la solicitud o que la red no está disponible. Solucione problemas de la red y del servidor NTP.
Escenario 1: Problema de red:
Utilice ping para comprobar si se puede acceder al servidor NTP y siga la solución de problemas de red para comprobarlo. Una vez que se confirma el problema de red, pida al usuario que se comunique con el equipo de red y confirme que el problema de red se solucionó.
Escenario 2: IP de NTP o problema de servicio incorrectos:
Si se puede hacer ping al servidor NTP, es posible que el usuario ingrese la IP NTP incorrecta o que el servicio NTP tenga un problema. Confirme con el usuario que la dirección IP de NTP sea correcta o utilice otro servidor NTP si el usuario tiene uno y le solicitó que se comunique con su equipo de administración para realizar la comprobación. En ocasiones, un reinicio del servidor puede solucionar el problema, por lo que podemos intentar esa ruta, si el usuario lo acepta.
Escenario 3: Servidor NTP de Windows:
El servicio de hora de Windows implementa un NTP sin funciones completas. Si el usuario utiliza un servidor Windows como servidor NTP, el rootdisp puede ser superior a 1000. En ese caso, configure el servidor NTP de Windows para sincronizar un servidor NTP externo confiable.
Si la solicitud en reach=yespero condition=rejectuso ntpq con assoc y rv Para comprobar el flash code, dispersiony rootdisp.
vrm:~ # ntpq -c assoc ind assid status conf reach auth condition last_event cnt =========================================================== 1 3898 9014 yes yes none reject reachable 1
Nota: La variable assoc puede mostrar la opción assid que se necesita para rv más tarde.
Utilice la función rv para obtener el comando flash code, dispersiony rootdisp.
Ejecute el comando ntpq para ingresar el comando ntpq shell, luego use rv assid para obtener la información detallada.
ntpq ntpq> rv 3898 associd=3898 status=9014 conf, reach, sel_reject, 1 event, reachable, srcadr=10.XX.1XX.1X0, srcport=123, dstadr=10.XX.1XX.1X1, dstport=123, leap=00, stratum=12, precision=-6, rootdelay=31.250, rootdisp=1814.209, refid=10.XX.XX.2X6, reftime=e0cff348.12fb407d Wed, Jul 10 2019 5:16:56.074, rec=e0cff42b.60680b73 Wed, Jul 10 2019 5:20:43.376, reach=377, unreach=0, hmode=3, pmode=4, hpoll=6, ppoll=6, headway=50, flash=400 peer_dist, keyid=0, offset=-2536.264, delay=0.354, dispersion=16.515, jitter=4.414, xleave=0.038, filtdelay= 0.35 0.29 0.32 0.26 0.28 3.22 0.28 0.35, filtoffset= -2536.2 -2538.2 -2529.4 -2536.2 -2541.6 -2530.0 -2532.5 -2538.1, filtdisp= 15.63 16.63 17.59 18.55 19.53 20.53 21.52 22.50 flash=400 peer_dist #reject reason dispersion=16.515 #it presents the error/variance between that NTP server and client rootdisp=1814.209 #it presents the total amount of error/variance from the root NTP server to client
flash=400 peer_dist Indica que la distancia al servidor NTP raíz es demasiado larga. No es apto para sincronizar.
Encuentre más información sobre el código flash en el siguiente enlace:
https://www.eecis.udel.edu/~mills/ntp/html/decode.html#flashGeneralmente dispersion un valor superior a 1000 se considera un servidor NTP no apto. Si Windows NTP Server está configurado para sincronizar la hora consigo mismo o los parámetros no están configurados correctamente, el rootdisp es superior a 1000 y se debe corregir la configuración de NTP en Windows Server.
Consulte el siguiente artículo de la base de conocimientos de Microsoft para configurar el servidor de hora de Windows.
https://support.microsoft.com/en-us/help/816042/how-to-configure-an-authoritative-time-server-in-windows-serverNota: Cambio MaxPosPhaseCorrection, MaxNegPhaseCorrection y SpecialPollInterval a 300 segundos
Situación 4: Red inestable entre el servidor NTP y el servidor NTP externo:
Siga la solución de problemas de red para verificar la red, puede usar ping para verificar si hay alta latencia.