ECS:xDoctor:RAP081:症狀代碼:2048: 所有 NTP 伺服器都不適合同步處理

Summary: xDoctor 偵測到網路時間通訊協定 (NTP) 精靈問題。

This article applies to This article does not apply to This article is not tied to any specific product. Not all product versions are identified in this article.

Symptoms

ECS 機架中的所有節點都應執行 NTP 精靈,且設定的 NTP 伺服器應能同步時間。否則,這可能會導致前端數據引入問題。

症狀

訊息

NTP_NOT_SUITABLE_ERROR

訊息 = 所有 NTP 伺服器都不適合同步處理。
額外 = [節點清單]

Cause

如果未在 24 小時內發生上述症狀,則仍構成警告。
24 小時後,如果這種情況持續存在,嚴重程度將會增加為錯誤,並報告 RAP081。

Resolution

這表示在「額外」欄位中列出的每個節點上,無法與 NTP 伺服器同步。

驗證:
1.取得每個列出節點上的 NTP 伺服器清單:

命令:

# 追蹤資訊 -r |grep NTP

範例:

admin@node1:~> getrackinfo -r | grep NTP
NTPServer = xxx.xxx.xxx.xxx

2.針對步驟 1 中列出的每個 NTP 伺服器,測試其是否能夠同步時間。

命令:

# sudo ntpdate -p 2 -d <NTP IP 位址/NTP FQDN>

# sudo ntpdate -p 2 -d 'getrackinfo -r |grep NTP |grep -oP “(?:[0-9]{1,3}\.){3}[0-9]{1,3}“'

範例(能夠同步時間):

admin@node1:~> sudo ntpdate -p 2 -d xxx.xxx.xxx.xxx
22 Feb 13:47:48 ntpdate[110901]: ntpdate 4.2.8p11@1.3728-o Thu Jun 14 09:26:52 UTC 2018 (1)
尋找主機 <NTP IP 位址> 和服務 ntp
<NTP IP 位址> 反轉為 <NTP 主機名稱>
主機:<NTP 主機名稱>
傳輸(<NTP IP 位址>)
接收(<NTP IP 位址>)
傳輸(<NTP IP 位址>)
接收(<NTP IP 位址>)
伺服器 <NTP IP 位址>,連接埠 123
層 2,精度 -24,leap 00,信任 000
refid [<NTP IP 位址>],延遲 0.02615,離散 0.00003
傳輸 2,在濾波器 2
參考時間:    e01a7b0d.af9e6616 週五, Feb 22 2019 13:43:41.686
原始時間戳: e01a7c06.748e0c65 週五, Feb 22 2019 13:47:50.455
傳輸時間戳:  e01a7c06.7478b000 週五, 2月 22 2019 13:47:50.454
篩選器延遲:  0.02635 0.02615 0.00000 0.00000
0.00000 0.00000 0.00000 0.00000
濾波器偏移:0.000043 -0.00002 0.000000 0.000000
0.000000 0.000000 0.000000 0.000000
延遲 0.02615,離散 0.00003
偏移 -0.000022

22 Feb 13:47:50 ntpdate[110901]: 調整時間伺服器 <NTP IP 位址> 偏移 -0.000022 秒

範例:(如果它無法同步它輸出的時間)

admin@node1:~> sudo ntpdate -p 2 -d xxx.xxx.xxx.xxx
22 Feb 13:47:48 ntpdate[110901]: ntpdate 4.2.8p11@1.3728-o Thu Jun 14 09:26:52 UTC 2018 (1)
尋找主機 <NTP IP 位址> 和服務 ntp
<NTP IP 位址> 反轉為 <NTP 主機名稱>
主機:<NTP 主機名稱傳輸(<NTP IP 位址>)
傳輸(<NTP IP 位址>)
傳輸(<NTP IP 位址>)

伺服器 <NTP IP 位址>,連接埠 123
層 2,精度 -24,leap 00,信任 000
refid [<NTP IP 位址>],延遲 0.02615,離散 0.00003
傳輸 2,在過濾器 2
中參考時間:>
    e01a7b0d.af9e6616 週五, Feb 22 2019 13:43:41.686
原始時間戳: e01a7c06.748e0c65 週五, Feb 22 2019 13:47:50.455
傳輸時間戳:  e01a7c06.7478b000 週五, 2月 22 2019 13:47:50.454
篩選器延遲:  0.02635 0.02615 0.00000 0.00000
0.00000 0.00000 0.00000 0.00000
濾波器偏移:0.000043 -0.00002 0.000000 0.000000
0.000000 0.000000 0.000000 0.000000
延遲 0.02615,離散 0.00003
偏移 -0.000022

22 Feb 13:47:50 ntpdate[112232]: 找不到適合同步的伺服器

3.將 FQDN 新增至 getrackinfo -r 結果中的 NTP 區段。

命令:

# sudo setrackinfo -a NTPServer < NTP FQDN >

4.檢查網路分隔和靜態路由,因為透過原則式路由從管理介面傳送的 NTP 可能會導致問題。

命令:

# getrackinfo -n;Getrackinfo -t

範例:

admin@node1:~>getrackinfo -n;getrackinfo -t
命名網路
==============
節點 ID 網路 IP 位址 網路遮罩閘道 VLAN 介面
靜態路由清單
=================
節點 ID 網路遮罩閘道介面

5.確認 NTP 伺服器是否在其環境中進行偵聽,且通常是防火牆封鎖連接埠。 

命令:

# sudo ntpq-c as

範例:(在下方我們看到一個 NTP 伺服器無法連線,另一個可能因為 ACL 而遭到封鎖)

admin@node1:~> sudo ntpq -c as
ind assid status conf 達到驗證條件 last_event CNT
===========================================================
1 56633 8011 是 否 無 拒絕 動員 1

6.檢查 NTP 中是否有任何日期漂移。 

命令:

# viprexec “date +%s” 2>&1 | grep “^15”

範例:

admin@node1:~>Viprexec “date +%s” 2>&1 | grep “^15”
1554470147
1554470111
1554470096
1554470142
1554470144
1554470109
1554470124
1554470140

7.檢查 ntpd 服務狀態,然後重新啟動服務。(即使狀態為啟動並執行,請繼續重新啟動。)
注意:ntpd.service 是一項不影響的服務。

命令:

# Viprexec systemctl status ntpd.service |grep Active:

範例:

admin@node1:~> viprexec systemctl status ntpd.service | grep Active:
   有效:自 2019-08-06 星期二 02:49:06 UTC 起處於活動狀態(正在運行);1天18小時前
活躍:自週二 2019-08-06 02:49:07 UTC; 1天18小時 前
活躍:自週三 2019-08-07 20:13:27 UTC; 58分鐘前
活躍:自週二 2019-08-06 02:49:06 UTC; 1天18小時前
活躍:自週二 2019-08-06 02:49:07 UTC; 1天18小時 前
活躍:自週二 2019-08-06 02:49:07 UTC 以來處於活動狀態(正在運行);1 天 18小時 前
活動: 自 Tue 2019-08-06 02:49:07 UTC 起處於活動狀態(正在運行);1天 18小時 前
啟用中:自 Tue 2019-08-06 02:49:07 UTC 起啟用 (執行中);1 天 18h 前

命令: 

# Viprexec systemctl restart NTPD.Service

範例:

admin@node1:~> viprexec systemctl restart ntpd.service
主機輸出:192.168.219.8
主機 的輸出:192.168.219.7
主機 的輸出:192.168.219.6
主機 的輸出:192.168.219.4
主機 的輸出:192.168.219.3
主機 的輸出:192.168.219.2
主機 的輸出:192.168.219.5
主機 的輸出:192.168.219.1

8.在所有節點上驗證 md5sum ntp.conf 檔案。

命令:

# viprexec “sudo md5sum /etc/ntp.conf”

範例:

admin@node1:~> viprexec “sudo md5sum /etc/ntp.conf”

主機輸出:192.168.219.2
741f0abb12ac82a21f150004bd407334 /etc/ntp.conf

主機輸出:192.168.219.5
741f0abb12ac82a21f150004bd407334 /etc/ntp.conf

主機輸出:192.168.219.4
741f0abb12ac82a21f150004bd407334 /etc/ntp.conf

主機輸出:192.168.219.1
7da6eb8009abc18ed1875f1f15ade72a /etc/ntp.conf

主機輸出:192.168.219.3
741f0abb12ac82a21f150004bd407334 /etc/ntp.conf

主機輸出:192.168.219.8
741f0abb12ac82a21f150004bd407334 /etc/ntp.conf

主機輸出:192.168.219.6
741f0abb12ac82a21f150004bd407334 /etc/ntp.conf

主機輸出:192.168.219.7
741f0abb12ac82a21f150004bd407334 /etc/ntp.conf

注意:這可能是因為具有公共和管理介面,並且所有節點都配置為根據提供的最後一個配置退出公共。在舊版的 ECS 上,PBR 可能會停滯在一個節點為有效的位置,而其餘的節點似乎都在防火牆後面。

9.在 getrackinfo -r 結果中將 123 新增至 ns_mgmt,然後檢查 NTP 是否已開始傳送及接收。

命令:

# sudo setrackinfo -a ns_mgmt 123

範例:

admin@node1:~>sudo setrackinfo -a ns_mgmt 123

如果錯誤仍然存在,請將埠 123 放回公共介面,然後再次檢查同步。

命令:

# sudo setrackinfo -d ns_mgmt 123

範例:

admin@node1:~> sudo setrackinfo -d ns_mgmt 123

執行上述每個步驟後,檢查 NTP 同步的狀態。

主意:
這表示所設定的伺服器不是 NTP 伺服器,或未如預期運作。必須與客戶的網路團隊接洽以解決 NTP 問題。

Additional Information

如果上述解決方案無效,客戶的網路團隊必須介入以解決 NTP 問題。

針對「NTP 精靈未執行」(NTPD_NOT_RUNNING 的症狀,請參閱知識文章:
ECS:xDoctor:RAP081:症狀代碼:2048: NTP 精靈未執行

針對「所有 NTP 伺服器調整的偏移量均高於錯誤閾值」(NTP_ERROR_OFFSET_ERROR) 的症狀,請參閱知識文章:
ECS:xDoctor:RAP081:症狀代碼:2048: 所有 NTP 伺服器調整的偏移量都高於錯誤閾值

針對「系統時間差異高於錯誤閾值」的症狀,請參閱知識文章:
ECS:xDoctor:RAP081:症狀代碼:2048: 系統時差高於錯誤閾值

Affected Products

ECS

Products

ECS Appliance, ECS Appliance Gen 1, ECS Appliance Gen 2, ECS Appliance Gen 3, ECS Software
Article Properties
Article Number: 000230633
Article Type: Solution
Last Modified: 03 Oct 2024
Version:  2
Find answers to your questions from other Dell users
Support Services
Check if your device is covered by Support Services.