「VxRail:VxRailクラスターのNTPをトラブルシューティングする方法
Summary: ネットワーク タイム プロトコル(NTP)の問題をトラブルシューティングする方法。
Instructions
/etc/ntp.conf 直に。ホストでNTPを構成するには、次を参照してください。 https://knowledge.broadcom.com/external/article/313808
リアルタイム イベントを監視するには、 ntpq VxRail Managerから同期ステータスを確認するには、次の手順を実行します。
vrm:~ # ntpq -c assoc ind assid status conf reach auth condition last_event cnt =========================================================== 1 3898 961a yes yes none sys.peer sys_peer 1
注:NTPが正常に動作している場合、結果は次のようになります reach=yes、 condition=sys.peerの詳細を確認してください。
ntpq> rv 3898 associd=3898 status=961a conf, reach, sel_sys.peer, 1 event, sys_peer, srcadr=10.XX.1XX.1X0, srcport=123, dstadr=10.XX.1XX.1X1, dstport=123, leap=00, stratum=12, precision=-6, rootdelay=31.250, rootdisp=64.575, refid=10.62.68.236, reftime=e0d00ab8.2af01902 Wed, Jul 10 2019 6:56:56.167, rec=e0d00c5e.d78d706e Wed, Jul 10 2019 7:03:58.842, reach=377,
reach が yes ではなく、条件が sys.peer でない場合 (つまり、時刻の同期に問題がある場合) は、ローカル時刻と NTP サーバーの時刻を確認します。ローカル時間が 1000 秒より大きいまたは小さい場合、ntpd はクロックを設定しません。時刻は手動で設定する必要があります
次のステータスは、異常な同期ステータスを示しています。
vrm:~ # ntpq -c assoc ind assid status conf reach auth condition last_event cnt =========================================================== 1 58280 8011 yes no none reject mobilize 1
「 reach=no は、NTPサーバが要求に応答しないか、ネットワークが使用不可であることを意味します。ネットワークとNTPサーバーのトラブルシューティングを行います。
シナリオ1: ネットワークの問題:
pingを使用してNTPサーバーに到達可能かどうかを確認し、ネットワークのトラブルシューティングに従って確認します。ネットワークの問題が確認されたら、ネットワーク チームと連携して、ネットワークの問題が修正されたことを確認するようにユーザーに依頼します
シナリオ2: 間違ったNTP IPまたはサービスの問題:
NTPサーバーがping可能な場合は、ユーザーが間違ったNTP IPを入力したか、NTPサービスで問題が発生した可能性があります。NTP IPアドレスが正しいことをユーザーに確認するか、ユーザーが別のNTPサーバーを持っている場合はそれを使用して、管理チームと連携して確認するようにユーザーに依頼します。サーバーを再起動すると問題が解決する場合があるため、ユーザーが許容できる場合は、そのルートを試すことができます
シナリオ3: Windows NTPサーバー:
Windowsタイム サービスは、フル機能ではないNTPを実装しています。ユーザーがWindows ServerをNTPサーバーとして使用している場合、 rootdisp 1000より大きい場合があります。その場合は、高信頼性の外部NTPサーバーを同期するようにWindows NTPサーバーを構成します。
ここで、 reach=yesだがしかし condition=reject使う ntpq と assoc と rv 確認するには、 flash code、 dispersionと rootdispの詳細を確認してください。
vrm:~ # ntpq -c assoc ind assid status conf reach auth condition last_event cnt =========================================================== 1 3898 9014 yes yes none reject reachable 1
注:「 assoc オプションでは、 assid これは、次の場合に必要です。 rv 後で.
使用する rv コマンドを使用して flash code、 dispersionと rootdisp.
次のコマンドを実行します。 ntpq コマンドを入力して、 ntpq shell を使用する場合は、 rv assid 詳細情報を取得します。
ntpq ntpq> rv 3898 associd=3898 status=9014 conf, reach, sel_reject, 1 event, reachable, srcadr=10.XX.1XX.1X0, srcport=123, dstadr=10.XX.1XX.1X1, dstport=123, leap=00, stratum=12, precision=-6, rootdelay=31.250, rootdisp=1814.209, refid=10.XX.XX.2X6, reftime=e0cff348.12fb407d Wed, Jul 10 2019 5:16:56.074, rec=e0cff42b.60680b73 Wed, Jul 10 2019 5:20:43.376, reach=377, unreach=0, hmode=3, pmode=4, hpoll=6, ppoll=6, headway=50, flash=400 peer_dist, keyid=0, offset=-2536.264, delay=0.354, dispersion=16.515, jitter=4.414, xleave=0.038, filtdelay= 0.35 0.29 0.32 0.26 0.28 3.22 0.28 0.35, filtoffset= -2536.2 -2538.2 -2529.4 -2536.2 -2541.6 -2530.0 -2532.5 -2538.1, filtdisp= 15.63 16.63 17.59 18.55 19.53 20.53 21.52 22.50 flash=400 peer_dist #reject reason dispersion=16.515 #it presents the error/variance between that NTP server and client rootdisp=1814.209 #it presents the total amount of error/variance from the root NTP server to client
flash=400 peer_dist は、ルートNTPサーバーまでの距離が長すぎることを示します。同期には適していません。
フラッシュ コードの詳細については、次のリンクを参照してください。
https://www.eecis.udel.edu/~mills/ntp/html/decode.html#flash
一般的に dispersion 1000を超えるNTPサーバーは、不適合と見なされます。Windows NTPサーバーがそれ自体と時刻を同期するように構成されている場合、またはパラメーターが正しく構成されていない場合、 rootdisp が1000を超えている場合、Windows ServerのNTP構成を修正する必要があります。
Windowsタイム サーバーを構成するには、次のMicrosoft KB記事を参照してください
https://support.microsoft.com/en-us/help/816042/how-to-configure-an-authoritative-time-server-in-windows-server
手記:変更 MaxPosPhaseCorrection、 MaxNegPhaseCorrection と SpecialPollInterval を 300 秒に変更
シナリオ 4: NTPサーバーと外部NTPサーバー間のネットワークが不安定です。
ネットワークのトラブルシューティングに従ってネットワークを確認します。pingを使用して高レイテンシーがあるかどうかを確認できます。