VxRail: Como solucionar problemas de NTP em um VxRail Cluster
Summary: Como solucionar problemas do Network Time Protocol (NTP).
Instructions
/etc/ntp.conf diretamente. Para configurar o NTP nos hosts, consulte: https://knowledge.broadcom.com/external/article/313808
Use ntpq Para verificar o status da sincronização no VxRail Manager:
vrm:~ # ntpq -c assoc ind assid status conf reach auth condition last_event cnt =========================================================== 1 3898 961a yes yes none sys.peer sys_peer 1
Nota: Se o NTP funcionar bem, o resultado deverá ser reach=yes, condition=sys.peer.
ntpq> rv 3898 associd=3898 status=961a conf, reach, sel_sys.peer, 1 event, sys_peer, srcadr=10.XX.1XX.1X0, srcport=123, dstadr=10.XX.1XX.1X1, dstport=123, leap=00, stratum=12, precision=-6, rootdelay=31.250, rootdisp=64.575, refid=10.62.68.236, reftime=e0d00ab8.2af01902 Wed, Jul 10 2019 6:56:56.167, rec=e0d00c5e.d78d706e Wed, Jul 10 2019 7:03:58.842, reach=377,
Se o alcance não for sim e a condição não for sys.peer (o que significa que a sincronização de hora está com problema), verifique a hora local e a hora do servidor NTP. Se a hora local for maior ou menor que 1.000 segundos, o ntpd não definirá o relógio. A hora deve ser definida manualmente.
O status a seguir mostra o status de sincronização anormal:
vrm:~ # ntpq -c assoc ind assid status conf reach auth condition last_event cnt =========================================================== 1 58280 8011 yes no none reject mobilize 1
A coluna reach=no significa que o servidor NTP não responde à solicitação ou a rede está indisponível. Solucione problemas da rede e do servidor NTP.
Cenário 1: Problema de rede:
Use ping para verificar se o servidor NTP está acessível e siga a solução de problemas de rede para verificar. Quando o problema de rede for confirmado, peça ao usuário para envolver a equipe de rede e confirmar se o problema de rede foi corrigido.
Cenário 2: Problema incorreto de serviço ou IP do NTP:
Se for possível fazer ping no servidor NTP, pode ser que o usuário insira o IP do NTP errado ou que o serviço NTP tenha um problema. Confirme com o usuário se o endereço IP do NTP está correto ou use outro servidor NTP se o usuário tiver um e pediu para envolver a equipe de administração dele para verificar. Às vezes, uma reinicialização do servidor pode corrigir o problema, então podemos tentar essa rota, se isso for aceitável para o usuário.
Cenário 3: Servidor NTP do Windows:
O serviço de horário do Windows implementa um NTP não completo. Se o usuário usar um Windows Server como servidor NTP, o rootdisp pode ser maior que 1000. Nesse caso, configure o Windows NTP Server para sincronizar um servidor NTP externo confiável.
Se a solicitação do reach=yesmas condition=rejectusar ntpq por assoc e rv para verificar o flash code, dispersione rootdisp.
vrm:~ # ntpq -c assoc ind assid status conf reach auth condition last_event cnt =========================================================== 1 3898 9014 yes yes none reject reachable 1
Nota: A coluna assoc pode mostrar a assid que é necessário para rv posterior.
Use o botão rv para obter o comando flash code, dispersione rootdisp.
Execute o ntpq para inserir o comando ntpq shell e, em seguida, use rv assid para obter as informações detalhadas.
ntpq ntpq> rv 3898 associd=3898 status=9014 conf, reach, sel_reject, 1 event, reachable, srcadr=10.XX.1XX.1X0, srcport=123, dstadr=10.XX.1XX.1X1, dstport=123, leap=00, stratum=12, precision=-6, rootdelay=31.250, rootdisp=1814.209, refid=10.XX.XX.2X6, reftime=e0cff348.12fb407d Wed, Jul 10 2019 5:16:56.074, rec=e0cff42b.60680b73 Wed, Jul 10 2019 5:20:43.376, reach=377, unreach=0, hmode=3, pmode=4, hpoll=6, ppoll=6, headway=50, flash=400 peer_dist, keyid=0, offset=-2536.264, delay=0.354, dispersion=16.515, jitter=4.414, xleave=0.038, filtdelay= 0.35 0.29 0.32 0.26 0.28 3.22 0.28 0.35, filtoffset= -2536.2 -2538.2 -2529.4 -2536.2 -2541.6 -2530.0 -2532.5 -2538.1, filtdisp= 15.63 16.63 17.59 18.55 19.53 20.53 21.52 22.50 flash=400 peer_dist #reject reason dispersion=16.515 #it presents the error/variance between that NTP server and client rootdisp=1814.209 #it presents the total amount of error/variance from the root NTP server to client
flash=400 peer_dist indica que a distância até o servidor NTP raiz é muito longa. Não é possível sincronizá-lo.
Encontre mais informações sobre código flash no seguinte link:
https://www.eecis.udel.edu/~mills/ntp/html/decode.html#flashGeralmente dispersion acima de 1.000 é considerado servidor NTP inadequado. Se o Windows NTP Server estiver configurado para sincronizar o horário consigo mesmo ou se os parâmetros não estiverem configurados corretamente, o rootdisp for maior que 1000 e a configuração de NTP no Windows Server deve ser corrigida.
Consulte o seguinte artigo da base de conhecimento da Microsoft para configurar o servidor de horário do Windows.
https://support.microsoft.com/en-us/help/816042/how-to-configure-an-authoritative-time-server-in-windows-serverNota: Mudar MaxPosPhaseCorrection, MaxNegPhaseCorrection e SpecialPollInterval até 300 segundos
Cenário 4: Rede instável entre o servidor NTP e o servidor NTP externo:
Siga a solução de problemas de rede para verificar a rede, pode usar o ping para verificar se há alta latência.