判斷 Avamar 系統是否遇到時間同步 (NTP) 問題。
摘要: 如何判斷 Avamar 系統是否遇到時間同步 (NTP) 問題。
說明
如果 Avamar 系統內的節點未進行時間同步,我們可以預期下列行為類型:
- Avamar 伺服器無法啟動
- 節點離線
- HFSchck 故障, MSG_ERR_CGSAN_FAILED
- HFScheck 故障並 顯示MSG_ERR_HFSCHECKERRORS
- 檢查點故障
- 垃圾收集失敗
- 資料一致性問題 (如果垃圾收集期間的時間變更)
因時間同步而經常報告的錯誤訊息範例:
-
samconn:checkallsucceed request failed DPNTIMECHECK=230
-
嚴重錯誤:<0001> dpn 時間不相符:同步時鐘和重試
- 錯誤:<0001> dpnchckmanager::verifyStartup cgsan 意外死亡。
- 及時收到的有效回應不足
- 時間同步 (ntpd) 伺服器的問題
- 時間同步客戶端問題
- 網路問題
本文可協助讀者判斷 Avamar 系統是否遇到時間同步問題。解決問題超出本文的範圍。
有許多網站包含 NTP 故障診斷,建議讀者進行調查。寫入時可用的實用 Web URL 會列在「外部連結」區段中。
若要繼續:
1.以每個 KB Avamar 的系統管理員身分登入 Avamar 伺服器:如何登入 Avamar 伺服器並載入各種金鑰。
2.若要判斷 Avamar 節點是否時間同步,請檢查 Avamar 系統上每個節點的目前時間和日期。如需範例輸出,請參閱 附錄 A 。
mapall --all --parallel '/bin/date'
當所有節點回報相同的日期和時間時,這表示時間已在此系統上的所有節點之間完全同步。
3.若要讓節點上的時間保持同步,Avamar 使用網路時間通訊協定 (NTP)。Linux 命令「ntpq -pn」傳回時間狀態同步處理。如需範例輸出,請參閱 附錄 B 。
mapall --all --noerror '/usr/sbin/ntpq -p'
4.一般 Avamar 伺服器觀察:
- 所有節點都設定為偏好 128.xxx.xxx.xx 作為主要時間來源。
- 所有節點的次要時間來源是「avmtest1」上的本機 BIOS 時鐘 (節點 0.s)。
- 第三級時間來源設定為avmtest2 (節點0.0),這本身指的是avmtest1。
- 所有節點都在與avmtest1同步處理。標示星號 (*) 的時間伺服器是節點目前同步處理的時間伺服器。
- 在此情況下,128.xxx.xxx.xx 位於遠端。其「reach」值為 0 (目前無法連線)。做為時間來源是沒用的。
- avmtest1 和avmtest2都有八進位377的可聯機註冊。這是可達到的最高數位。因此,節點都與次要來源同步。
5.查看節點 0.2 的 ntpq 輸出;
(0.2) ssh -x admin@10.64.18.164 '/usr/sbin/ntpq -p' remote refid st t when poll reach delay offset jitter ============================================================================== 128.xxx.xxx.xx .INIT. 16 u - 1024 0 0.000 0.000 4000.00 *avmtest1.emcvmw LOCAL(0) 9 u 54 256 377 0.085 -0.116 0.002 +avmtest2.emcvmw xx.xx.xx.xxx 10 u 56 256 377 0.090 0.073 0.012
我們瞭解:
- 節點0.2每256秒輪詢avmtest1
- 節點 0.2 目前與 avmtest1 同步處理
- avmtest1 位於 stra 帶狀 9,代表節點 0.2 位於階層 10。
- 節點0.2每256秒輪詢avmtest1一次。
- avmtest1 的可連線性註冊為八位 376。
- avmtest1 上的頻率比 avmtest1 的時鐘後方 0.116 毫秒 (或 116 微秒)。
- avmtest1 的 Roundtrip 延遲為 85 毫秒。
- 測量節點 0.2 和 avmtest1 之間的網路延遲變化 (抖動) 為 2 毫秒。
NTP 組態 (/etc/ntp.conf):
如果檢閱節點 0.2 上的 /etc/ntp.conf 檔案,它會對應到上方 的 ntpq 輸出。
#Customer premises / external time servers. # server xxx.xxx.xxx.xx <-- Primary time source (this is an external server located remote to the Avamar grid) # - - - - - # DPN time servers here and in the other module(s). # server xx.xx.xx.xxx <-- Secondary time source (this is the utility node) server xx.xx.xx.xxx <-- Tertiary time source (this is node 0.0)
測 井:
NTP 記錄會導向到 /var/log/messages 檔案。
若要檢視 NTP 相關記錄,請針對「ntp」格解 /var/log/messages* 的內容
如果 Avamar 遇到時間同步問題,則問題必須修正。解決時間同步處理問題超出本文的範圍。
如果外部時間伺服器不可靠,如上所述範例所示,可以使用內部時間伺服器。內部時間可能會從UTC緩慢漂移,但最重要的是,資料節點是彼此同步的時間。
Avamar 公用程式 詢問時間工具可用來選取NTP的新偏好時間來源。
請參閱 Avamar:如何使用詢問時間
在 Avamar 伺服器上設定 NTP其他資訊:
http://support.microsoft.com/kb/939322 - Windows Domain 控制器不應長時間保留使用。
其他資訊
所有顯示同步時間的節點範例。
注意:「--parallel」旗標會同時在每個節點上執行命令。在時間同步的系統上,您會看到類似以下內容的輸出:
注意:The 公用程式節點 (0.x) 設定為本機時區,在此範例中的「BST」,而數據節點則設為「UTC」時區。這是預期中的行為。
mapall --all --parallel 'date' Using /usr/local/avamar/var/probe.xml (0.s) ssh -x admin@xx.xx.xx.xxx 'date' (0.0) ssh -x admin@xx.xx.xx.xxx 'date' (0.1) ssh -x admin@xx.xx.xx.xxx 'date' (0.2) ssh -x admin@xx.xx.xx.xxx 'date' Mon Jun 20 12:01:12 BST 2011 Mon Jun 20 11:01:12 UTC 2011 Mon Jun 20 11:01:12 UTC 2011 Mon Jun 20 11:01:12 UTC 2011
附錄 B:
注意:如果將「n」旗標新增至下列命令 (ntpq -pn),則不會使用名稱解析。輸出會快速傳回,並顯示IP位址而非主機名。這會影響輸出的可讀性。
mapall --all --noerror '/usr/sbin/ntpq -p' (0.s) ssh -x admin@10.xx.xx.xxx '/usr/sbin/ntpq -p' remote refid st t when poll reach delay offset jitter ============================================================================== 128.xxx.xxx.xx .INIT. 16 u - 1024 0 0.000 0.000 4000.00 *LOCAL(0) LOCAL(0) 8 l 8 64 377 0.000 0.000 0.001 (0.0) ssh -x admin@10.xx.xx.xxx '/usr/sbin/ntpq -p' remote refid st t when poll reach delay offset jitter ============================================================================== 128.xxx.xxx.xx .INIT. 16 u - 1024 0 0.000 0.000 4000.00 *avmtest1.emcvmw LOCAL(0) 9 u 750 1024 377 0.126 -0.197 0.001 (0.1) ssh -x admin@10.xx.xx.xxx '/usr/sbin/ntpq -p' remote refid st t when poll reach delay offset jitter ============================================================================== 128.xxx.xxx.xx .INIT. 16 u - 1024 0 0.000 0.000 4000.00 *avmtest1.emcvmw LOCAL(0) 9 u 194 256 377 0.095 -0.139 0.004 +avmtest2.emcvmw xx.xx.xx.xxx 10 u 189 256 377 0.097 0.062 0.005 (0.2) ssh -x admin@10.xx.xx.xxx '/usr/sbin/ntpq -p' remote refid st t when poll reach delay offset jitter ============================================================================== 128.xxx.xxx.xx .INIT. 16 u - 1024 0 0.000 0.000 4000.00 *avmtest1.emcvmw LOCAL(0) 9 u 54 256 377 0.085 -0.116 0.002 +avmtest2.emcvmw xx.xx.xx.xxx 10 u 56 256 377 0.090 0.073 0.012