确定 Avamar 系统是否遇到时间同步 (NTP) 问题。
摘要: 如何确定 Avamar 系统是否遇到时间同步 (NTP) 问题。
說明
如果 Avamar 系统中的节点未同步时间,我们预计会出现以下行为类型:
- Avamar Server 无法启动
- 节点离线
- HFScheck 失败并 显示MSG_ERR_CGSAN_FAILED
- HFScheck 失败并 显示MSG_ERR_HFSCHECKERRORS
- 检查点失败
- 垃圾数据收集失败
- 数据一致性问题(如果垃圾数据收集期间的时间发生变化)
因时间同步而经常报告的错误消息示例:
-
samconn::checkallsucceed request failed DPNTIMECHECK=230
-
致命错误:<0001> dpn 时间不匹配:同步时钟并重试
- ERROR: <0001> dpncheckmanager::verifyStartup cgsan 意外死亡。 终止
- 及时收到的有效响应不足
- 时间同步 (ntpd) 服务器出现问题
- 时间同步客户端问题
- 网络问题
本文可帮助读者确定 Avamar 系统是否遇到时间同步问题。解决此问题超出了本文的范围。
有许多网站涵盖 NTP 故障排除,建议读者调查这些网站。“外部链接”部分列出了写入时可用的有用 Web URL。
要继续:
1.按 KB Avamar 以管理员身份登录 Avamar Server:如何登录 Avamar Server 并加载各种密钥。
2.要确定 Avamar 节点是否已同步时间,请检查 Avamar 系统上每个节点的当前时间和日期。有关示例输出,请参阅 附录 A 。
mapall --all --parallel '/bin/date'
当所有节点报告相同的日期和时间时,这意味着此系统上的所有节点之间的时间完全同步。
3.为了保持节点上的时间同步,Avamar 使用网络时间协议 (NTP)。Linux 命令“ntpq -pn”返回时间同步状态。有关输出示例,请参阅 附录 B 。
mapall --all --noerror '/usr/sbin/ntpq -p'
4.常规 Avamar Server 观察结果:
- 所有节点都设置为首选 128.xxx.xxx.xx 作为主要时间源。
- 所有节点的辅助时间源是“avmtest1”(节点 0.s)上的本地 BIOS 时钟。
- 第三时间源设置为 avmtest2(节点 0.0),这本身指的是 avmtest1。
- 所有节点都与 avmtest1 同步。标有星号 (*) 的时间服务器是节点当前正在与 之同步的时间服务器。
- 在这种情况下,128.xxx.xxx.xx 远程位于 。它的“reach”值为 0(当前无法访问)。它作为时间源是无用的。
- avmtest1 和 avmtest2 都有八进制 377 的可访问性寄存器。这是可实现的最高数字。因此,节点都与辅助源同步。
5.查看节点 0.2 的 ntpq 输出;
(0.2) ssh -x admin@10.64.18.164 '/usr/sbin/ntpq -p' remote refid st t when poll reach delay offset jitter ============================================================================== 128.xxx.xxx.xx .INIT. 16 u - 1024 0 0.000 0.000 4000.00 *avmtest1.emcvmw LOCAL(0) 9 u 54 256 377 0.085 -0.116 0.002 +avmtest2.emcvmw xx.xx.xx.xxx 10 u 56 256 377 0.090 0.073 0.012
我们了解到:
- 节点 0.2 每 256 秒轮询一次 avmtest1
- 节点 0.2 当前正在与 avmtest1 同步
- avmtest1 处于层级 9,这意味着节点 0.2 处于层级 10。
- 节点 0.2 每 256 秒轮询一次 avmtest1。
- avmtest1 的可访问性寄存器为八进制 376。
- avmtest1 上的时钟比 avmtest1 上的时钟落后 0.116 毫秒(或 116 微秒)。
- avmtest1 的往返延迟为 85 毫秒。
- 测量节点 0.2 和 avmtest1 之间的网络延迟差异(抖动)为 2 毫秒。
NTP 配置 (/etc/ntp.conf):
如果查看节点 0.2 上的 /etc/ntp.conf 文件,则与上面 的 ntpq 输出相对应。
#Customer premises / external time servers. # server xxx.xxx.xxx.xx <-- Primary time source (this is an external server located remote to the Avamar grid) # - - - - - # DPN time servers here and in the other module(s). # server xx.xx.xx.xxx <-- Secondary time source (this is the utility node) server xx.xx.xx.xxx <-- Tertiary time source (this is node 0.0)
测 井:
NTP 日志记录将定向到 /var/log/messages 文件。
要查看与 NTP 相关的日志记录,请将 /var/log/messages* 的内容用于 “ntp”
如果 Avamar 遇到时间同步问题,则必须修复此问题。解决时间同步问题超出了本文的范围。
如果外部时间服务器不可靠,如上述示例所示,使用内部时间服务器是可接受的。内部时间可能与 UTC 缓慢偏移,但最重要的注意事项是数据节点彼此同步时间。
Avamar 应用工具 asktime 工具可用于为 NTP 选择新的首选时间源。
请参阅 Avamar:如何使用 asktime
在 Avamar Server 上配置 NTP其他信息:
http://support.microsoft.com/kb/939322 - 不应将 Windows 域控制器用于正常保留时间。
其他資訊
显示同步时间的所有节点的示例。
提醒:“--parallel”标记同时在每个节点上运行 命令。在同步时间的系统上,您会看到类似于以下内容的输出:
注意:在此示例中,应用工具节点 (0.x) 设置为本地时区“BST”,而数据节点设置为“UTC”时区。这是预期的行为。
mapall --all --parallel 'date' Using /usr/local/avamar/var/probe.xml (0.s) ssh -x admin@xx.xx.xx.xxx 'date' (0.0) ssh -x admin@xx.xx.xx.xxx 'date' (0.1) ssh -x admin@xx.xx.xx.xxx 'date' (0.2) ssh -x admin@xx.xx.xx.xxx 'date' Mon Jun 20 12:01:12 BST 2011 Mon Jun 20 11:01:12 UTC 2011 Mon Jun 20 11:01:12 UTC 2011 Mon Jun 20 11:01:12 UTC 2011
附录 B:
注意:如果将“n”标记添加到以下命令 (ntpq -pn),则不会使用名称解析。将快速返回输出,并显示 IP 地址而不是主机名。这会影响输出的可读性。
mapall --all --noerror '/usr/sbin/ntpq -p' (0.s) ssh -x admin@10.xx.xx.xxx '/usr/sbin/ntpq -p' remote refid st t when poll reach delay offset jitter ============================================================================== 128.xxx.xxx.xx .INIT. 16 u - 1024 0 0.000 0.000 4000.00 *LOCAL(0) LOCAL(0) 8 l 8 64 377 0.000 0.000 0.001 (0.0) ssh -x admin@10.xx.xx.xxx '/usr/sbin/ntpq -p' remote refid st t when poll reach delay offset jitter ============================================================================== 128.xxx.xxx.xx .INIT. 16 u - 1024 0 0.000 0.000 4000.00 *avmtest1.emcvmw LOCAL(0) 9 u 750 1024 377 0.126 -0.197 0.001 (0.1) ssh -x admin@10.xx.xx.xxx '/usr/sbin/ntpq -p' remote refid st t when poll reach delay offset jitter ============================================================================== 128.xxx.xxx.xx .INIT. 16 u - 1024 0 0.000 0.000 4000.00 *avmtest1.emcvmw LOCAL(0) 9 u 194 256 377 0.095 -0.139 0.004 +avmtest2.emcvmw xx.xx.xx.xxx 10 u 189 256 377 0.097 0.062 0.005 (0.2) ssh -x admin@10.xx.xx.xxx '/usr/sbin/ntpq -p' remote refid st t when poll reach delay offset jitter ============================================================================== 128.xxx.xxx.xx .INIT. 16 u - 1024 0 0.000 0.000 4000.00 *avmtest1.emcvmw LOCAL(0) 9 u 54 256 377 0.085 -0.116 0.002 +avmtest2.emcvmw xx.xx.xx.xxx 10 u 56 256 377 0.090 0.073 0.012