VxRail. Поиск и устранение неисправностей NTP в кластере VxRail
Summary: Поиск и устранение неисправностей Network Time Protocol (NTP).
Instructions
/etc/ntp.conf прямо. Сведения о настройке NTP на хостах см. в разделах https://knowledge.broadcom.com/external/article/313808
Используется, ntpq Чтобы проверить состояние синхронизации из VxRail Manager, выполните следующие действия.
vrm:~ # ntpq -c assoc ind assid status conf reach auth condition last_event cnt =========================================================== 1 3898 961a yes yes none sys.peer sys_peer 1
Примечание. Если NTP работает нормально, результат должен быть следующим reach=yes, condition=sys.peer.
ntpq> rv 3898 associd=3898 status=961a conf, reach, sel_sys.peer, 1 event, sys_peer, srcadr=10.XX.1XX.1X0, srcport=123, dstadr=10.XX.1XX.1X1, dstport=123, leap=00, stratum=12, precision=-6, rootdelay=31.250, rootdisp=64.575, refid=10.62.68.236, reftime=e0d00ab8.2af01902 Wed, Jul 10 2019 6:56:56.167, rec=e0d00c5e.d78d706e Wed, Jul 10 2019 7:03:58.842, reach=377,
Если reach не yes и condition не является sys.peer (что указывает на проблему с синхронизацией времени), проверьте местное время и время сервера NTP. Если местное время больше или меньше 1000 секунд, ntpd не установит часы. Время необходимо установить вручную.
Аномальное состояние синхронизации отображается в следующем состоянии:
vrm:~ # ntpq -c assoc ind assid status conf reach auth condition last_event cnt =========================================================== 1 58280 8011 yes no none reject mobilize 1
Переменная reach=no означает, что NTP-сервер не отвечает на запрос или сеть недоступна. Выполните поиск и устранение неисправностей сети и сервера NTP.
Сценарий 1. Проблема с сетью:
Используйте команду ping, чтобы проверить, доступен ли NTP-сервер, и выполните действия по устранению неполадок сети. После подтверждения проблемы с сетью попросите пользователя привлечь сетевую группу и убедиться, что проблема с сетью устранена.
Сценарий 2. Неправильный IP-адрес NTP или проблема со службой:
Если проверка связи с сервером NTP может выполняться с помощью ping, возможно, пользователь вводит неверный IP-адрес NTP или в службе NTP возникла проблема. Вместе с пользователем убедитесь в правильности IP-адреса NTP или используйте другой сервер NTP, если он есть у пользователя и он попросил пользователя обратиться к группе администраторов для проверки. Иногда перезагрузка сервера может устранить проблему, поэтому мы можем попробовать этот путь, если это приемлемо для пользователя.
Сценарий 3: NTP-сервер Windows:
Служба времени Windows реализует неполнофункциональный NTP. Если пользователь использует Windows Server в качестве сервера NTP, то rootdisp может быть больше 1000. В этом случае настройте Windows NTP Server для синхронизации с надежным внешним NTP-сервером.
Если reach=yesно condition=rejectиспользование ntpq с assoc и rv Чтобы проверить flash code, dispersionи rootdisp.
vrm:~ # ntpq -c assoc ind assid status conf reach auth condition last_event cnt =========================================================== 1 3898 9014 yes yes none reject reachable 1
Примечание. Переменная assoc может показать assid который нужен для rv позже.
Используйте кнопку rv для получения команды flash code, dispersionи rootdisp.
Запустите команду ntpq для ввода ntpq shell, то используйте rv assid для получения подробной информации.
ntpq ntpq> rv 3898 associd=3898 status=9014 conf, reach, sel_reject, 1 event, reachable, srcadr=10.XX.1XX.1X0, srcport=123, dstadr=10.XX.1XX.1X1, dstport=123, leap=00, stratum=12, precision=-6, rootdelay=31.250, rootdisp=1814.209, refid=10.XX.XX.2X6, reftime=e0cff348.12fb407d Wed, Jul 10 2019 5:16:56.074, rec=e0cff42b.60680b73 Wed, Jul 10 2019 5:20:43.376, reach=377, unreach=0, hmode=3, pmode=4, hpoll=6, ppoll=6, headway=50, flash=400 peer_dist, keyid=0, offset=-2536.264, delay=0.354, dispersion=16.515, jitter=4.414, xleave=0.038, filtdelay= 0.35 0.29 0.32 0.26 0.28 3.22 0.28 0.35, filtoffset= -2536.2 -2538.2 -2529.4 -2536.2 -2541.6 -2530.0 -2532.5 -2538.1, filtdisp= 15.63 16.63 17.59 18.55 19.53 20.53 21.52 22.50 flash=400 peer_dist #reject reason dispersion=16.515 #it presents the error/variance between that NTP server and client rootdisp=1814.209 #it presents the total amount of error/variance from the root NTP server to client
flash=400 peer_dist Указывает, что расстояние до корневого сервера NTP слишком велико. Он непригоден для синхронизации.
Дополнительную информацию о флэш-коде можно найти по следующей ссылке:
https://www.eecis.udel.edu/~mills/ntp/html/decode.html#flashВообще dispersion больше 1000 считается непригодным NTP-сервером. Если сервер Windows NTP настроен на синхронизацию времени с самим собой или параметры настроены неправильно, то rootdisp больше 1000, и необходимо исправить конфигурацию NTP в Windows Server.
Сведения о настройке сервера времени Windows см. в следующей статье базы знаний Microsoft.
https://support.microsoft.com/en-us/help/816042/how-to-configure-an-authoritative-time-server-in-windows-serverЗаметка: Менять MaxPosPhaseCorrection, MaxNegPhaseCorrection и SpecialPollInterval до 300 секунд
Сценарий 4: Нестабильная сеть между сервером NTP и внешним сервером NTP:
Выполните поиск и устранение неисправностей сети, чтобы проверить сеть. Можно использовать ping, чтобы проверить высокую задержку.