ECS:xDoctor:RAP081:症狀代碼:2048: 所有 NTP 伺服器都不適合同步處理
Summary: xDoctor 偵測到網路時間通訊協定 (NTP) 精靈問題。
Symptoms
ECS 機架中的所有節點都應執行 NTP 精靈,且設定的 NTP 伺服器應能同步時間。否則,這可能會導致前端數據引入問題。
| 症狀 |
訊息 |
|---|---|
| NTP_NOT_SUITABLE_ERROR |
訊息 = 所有 NTP 伺服器都不適合同步處理。 |
Cause
如果未在 24 小時內發生上述症狀,則仍構成警告。
24 小時後,如果這種情況持續存在,嚴重程度將會增加為錯誤,並報告 RAP081。
Resolution
這表示在「額外」欄位中列出的每個節點上,無法與 NTP 伺服器同步。
驗證:
1.取得每個列出節點上的 NTP 伺服器清單:
命令:
# 追蹤資訊 -r |grep NTP
範例:
admin@node1:~> getrackinfo -r | grep NTP
NTPServer = xxx.xxx.xxx.xxx
2.針對步驟 1 中列出的每個 NTP 伺服器,測試其是否能夠同步時間。
命令:
# sudo ntpdate -p 2 -d <NTP IP 位址/NTP FQDN>
或
# sudo ntpdate -p 2 -d 'getrackinfo -r |grep NTP |grep -oP “(?:[0-9]{1,3}\.){3}[0-9]{1,3}“'
範例(能夠同步時間):
admin@node1:~> sudo ntpdate -p 2 -d xxx.xxx.xxx.xxx
22 Feb 13:47:48 ntpdate[110901]: ntpdate 4.2.8p11@1.3728-o Thu Jun 14 09:26:52 UTC 2018 (1)
尋找主機 <NTP IP 位址> 和服務 ntp
<NTP IP 位址> 反轉為 <NTP 主機名稱>
主機:<NTP 主機名稱>
傳輸(<NTP IP 位址>)
接收(<NTP IP 位址>)
傳輸(<NTP IP 位址>)
接收(<NTP IP 位址>)
伺服器 <NTP IP 位址>,連接埠 123
層 2,精度 -24,leap 00,信任 000
refid [<NTP IP 位址>],延遲 0.02615,離散 0.00003
傳輸 2,在濾波器 2
參考時間: e01a7b0d.af9e6616 週五, Feb 22 2019 13:43:41.686
原始時間戳: e01a7c06.748e0c65 週五, Feb 22 2019 13:47:50.455
傳輸時間戳: e01a7c06.7478b000 週五, 2月 22 2019 13:47:50.454
篩選器延遲: 0.02635 0.02615 0.00000 0.00000
0.00000 0.00000 0.00000 0.00000
濾波器偏移:0.000043 -0.00002 0.000000 0.000000
0.000000 0.000000 0.000000 0.000000
延遲 0.02615,離散 0.00003
偏移 -0.000022
22 Feb 13:47:50 ntpdate[110901]: 調整時間伺服器 <NTP IP 位址> 偏移 -0.000022 秒
範例:(如果它無法同步它輸出的時間)
admin@node1:~> sudo ntpdate -p 2 -d xxx.xxx.xxx.xxx
22 Feb 13:47:48 ntpdate[110901]: ntpdate 4.2.8p11@1.3728-o Thu Jun 14 09:26:52 UTC 2018 (1)
尋找主機 <NTP IP 位址> 和服務 ntp
<NTP IP 位址> 反轉為 <NTP 主機名稱>
主機:<NTP 主機名稱傳輸(<NTP IP 位址>)
傳輸(<NTP IP 位址>)
傳輸(<NTP IP 位址>)
伺服器 <NTP IP 位址>,連接埠 123
層 2,精度 -24,leap 00,信任 000
refid [<NTP IP 位址>],延遲 0.02615,離散 0.00003
傳輸 2,在過濾器 2
中參考時間:>
e01a7b0d.af9e6616 週五, Feb 22 2019 13:43:41.686
原始時間戳: e01a7c06.748e0c65 週五, Feb 22 2019 13:47:50.455
傳輸時間戳: e01a7c06.7478b000 週五, 2月 22 2019 13:47:50.454
篩選器延遲: 0.02635 0.02615 0.00000 0.00000
0.00000 0.00000 0.00000 0.00000
濾波器偏移:0.000043 -0.00002 0.000000 0.000000
0.000000 0.000000 0.000000 0.000000
延遲 0.02615,離散 0.00003
偏移 -0.000022
22 Feb 13:47:50 ntpdate[112232]: 找不到適合同步的伺服器
3.將 FQDN 新增至 getrackinfo -r 結果中的 NTP 區段。
命令:
# sudo setrackinfo -a NTPServer < NTP FQDN >
4.檢查網路分隔和靜態路由,因為透過原則式路由從管理介面傳送的 NTP 可能會導致問題。
命令:
# getrackinfo -n;Getrackinfo -t
範例:
admin@node1:~>getrackinfo -n;getrackinfo -t
命名網路
==============
節點 ID 網路 IP 位址 網路遮罩閘道 VLAN 介面
靜態路由清單
=================
節點 ID 網路遮罩閘道介面
5.確認 NTP 伺服器是否在其環境中進行偵聽,且通常是防火牆封鎖連接埠。
命令:
# sudo ntpq-c as
範例:(在下方我們看到一個 NTP 伺服器無法連線,另一個可能因為 ACL 而遭到封鎖)
admin@node1:~> sudo ntpq -c as
ind assid status conf 達到驗證條件 last_event CNT
===========================================================
1 56633 8011 是 否 無 拒絕 動員 1
6.檢查 NTP 中是否有任何日期漂移。
命令:
# viprexec “date +%s” 2>&1 | grep “^15”
範例:
admin@node1:~>Viprexec “date +%s” 2>&1 | grep “^15”
1554470147
1554470111
1554470096
1554470142
1554470144
1554470109
1554470124
1554470140
7.檢查 ntpd 服務狀態,然後重新啟動服務。(即使狀態為啟動並執行,請繼續重新啟動。)
注意:ntpd.service 是一項不影響的服務。
命令:
# Viprexec systemctl status ntpd.service |grep Active:
範例:
admin@node1:~> viprexec systemctl status ntpd.service | grep Active:
有效:自 2019-08-06 星期二 02:49:06 UTC 起處於活動狀態(正在運行);1天18小時前
活躍:自週二 2019-08-06 02:49:07 UTC; 1天18小時 前
活躍:自週三 2019-08-07 20:13:27 UTC; 58分鐘前
活躍:自週二 2019-08-06 02:49:06 UTC; 1天18小時前
活躍:自週二 2019-08-06 02:49:07 UTC; 1天18小時 前
活躍:自週二 2019-08-06 02:49:07 UTC 以來處於活動狀態(正在運行);1 天 18小時 前
活動: 自 Tue 2019-08-06 02:49:07 UTC 起處於活動狀態(正在運行);1天 18小時 前
啟用中:自 Tue 2019-08-06 02:49:07 UTC 起啟用 (執行中);1 天 18h 前
命令:
# Viprexec systemctl restart NTPD.Service
範例:
admin@node1:~> viprexec systemctl restart ntpd.service
主機輸出:192.168.219.8
主機 的輸出:192.168.219.7
主機 的輸出:192.168.219.6
主機 的輸出:192.168.219.4
主機 的輸出:192.168.219.3
主機 的輸出:192.168.219.2
主機 的輸出:192.168.219.5
主機 的輸出:192.168.219.1
8.在所有節點上驗證 md5sum ntp.conf 檔案。
命令:
# viprexec “sudo md5sum /etc/ntp.conf”
範例:
admin@node1:~> viprexec “sudo md5sum /etc/ntp.conf”
主機輸出:192.168.219.2
741f0abb12ac82a21f150004bd407334 /etc/ntp.conf
主機輸出:192.168.219.5
741f0abb12ac82a21f150004bd407334 /etc/ntp.conf
主機輸出:192.168.219.4
741f0abb12ac82a21f150004bd407334 /etc/ntp.conf
主機輸出:192.168.219.1
7da6eb8009abc18ed1875f1f15ade72a /etc/ntp.conf
主機輸出:192.168.219.3
741f0abb12ac82a21f150004bd407334 /etc/ntp.conf
主機輸出:192.168.219.8
741f0abb12ac82a21f150004bd407334 /etc/ntp.conf
主機輸出:192.168.219.6
741f0abb12ac82a21f150004bd407334 /etc/ntp.conf
主機輸出:192.168.219.7
741f0abb12ac82a21f150004bd407334 /etc/ntp.conf
注意:這可能是因為具有公共和管理介面,並且所有節點都配置為根據提供的最後一個配置退出公共。在舊版的 ECS 上,PBR 可能會停滯在一個節點為有效的位置,而其餘的節點似乎都在防火牆後面。
9.在 getrackinfo -r 結果中將 123 新增至 ns_mgmt,然後檢查 NTP 是否已開始傳送及接收。
命令:
# sudo setrackinfo -a ns_mgmt 123
範例:
admin@node1:~>sudo setrackinfo -a ns_mgmt 123
如果錯誤仍然存在,請將埠 123 放回公共介面,然後再次檢查同步。
命令:
# sudo setrackinfo -d ns_mgmt 123
範例:
admin@node1:~> sudo setrackinfo -d ns_mgmt 123
執行上述每個步驟後,檢查 NTP 同步的狀態。
主意:
這表示所設定的伺服器不是 NTP 伺服器,或未如預期運作。必須與客戶的網路團隊接洽以解決 NTP 問題。
Additional Information
針對「NTP 精靈未執行」(NTPD_NOT_RUNNING 的症狀,請參閱知識文章:
ECS:xDoctor:RAP081:症狀代碼:2048: NTP 精靈未執行
針對「所有 NTP 伺服器調整的偏移量均高於錯誤閾值」(NTP_ERROR_OFFSET_ERROR) 的症狀,請參閱知識文章:
ECS:xDoctor:RAP081:症狀代碼:2048: 所有 NTP 伺服器調整的偏移量都高於錯誤閾值
針對「系統時間差異高於錯誤閾值」的症狀,請參閱知識文章:
ECS:xDoctor:RAP081:症狀代碼:2048: 系統時差高於錯誤閾值