Jak zjistit, zda u systému Avamar dochází k problému se synchronizací času (NTP).
摘要: Jak zjistit, zda u systému Avamar dochází k problému se synchronizací času (NTP).
說明
Pokud uzly v systému Avamar nejsou synchronizované, můžeme očekávat následující typy chování:
- Server Avamar se nedaří spustit
- Uzly jsou offline
- Kontrola HFS selže s MSG_ERR_CGSAN_FAILED
- Kontrola HFS selže s MSG_ERR_HFSCHECKERRORS
- Selhání kontrolních bodů
- Garbage Collection selže.
- Problémy s konzistencí dat (pokud se čas změní během garbage collection)
Příklady chybových zpráv, které jsou běžně hlášeny v důsledku ztráty synchronizace času:
-
samconn::checkallsucceed request failed DPNTIMECHECK=230
-
ZÁVAŽNÁ CHYBA: <0001> neshoda času dpn: synchronizace hodin a opakování pokusu
- ERROR: <0001> dpncheckmanager::verifyStartup cgsan neočekávaně ukončil.
- not enough valid responses received in time (nedostatek platných odpovědí v čase)
- Problémy se serverem synchronizace času (ntpd)
- Problémy s klientem synchronizace času
- Problémy se sítí
Tento článek pomáhá čtečce určit, zda u systému Avamar dochází k problému se synchronizací času. Řešení tohoto problému je mimo rozsah tohoto článku.
Existuje mnoho webových stránek, které se zabývají odstraňováním problémů NTP, a doporučujeme čtečku, aby je prošetřila. Užitečné webové adresy URL dostupné v době psaní jsou uvedeny v části "externí odkazy".
Chcete-li pokračovat:
1. Přihlaste se k serveru Avamar jako správce podle serveru KB Avamar: Jak se přihlásit k serveru Avamar a načíst různé klíče.
2. Chcete-li zjistit, zda jsou uzly Avamar synchronizované, zkontrolujte aktuální čas a datum každého uzlu v systému Avamar. Vzorový výstup viz PŘÍLOHA A .
mapall --all --parallel '/bin/date'
Pokud všechny uzly hlásí stejné datum a čas, znamená to, že čas je plně synchronizovaný mezi všemi uzly v tomto systému.
3. Aby byl čas synchronizovaný v uzlech, používá server Avamar protokol NTP (Network Time Protocol). Příkaz "ntpq -pn" systému Linux vrátí stav synchronizace času. Vzorový výstup viz PŘÍLOHA B .
mapall --all --noerror '/usr/sbin/ntpq -p'
4. Obecné pozorování serveru Avamar:
- Všechny uzly jsou nastaveny tak, aby jako primární zdroj času upřednostňovaly hodnotu 128.xxx.xxx.xx.
- Sekundárním zdrojem času pro všechny uzly jsou místní hodiny systému BIOS v "avmtest1" (uzel 0.s).
- Terciární zdroj času je nastaven na avmtest2 (uzel 0.0), který sám odkazuje na avmtest1.
- Všechny uzly se synchronizují s testem avmtest1. Časový server označený hvězdičkou (*) je ten, se kterým se uzel aktuálně synchronizuje.
- V tomto případě se 128.xxx.xxx.xx nachází vzdáleně. Má hodnotu "reach" 0 (v současné době nedostupnou). Je nepoužitelný jako zdroj času.
- avmtest1 a avmtest2 mají registr dostupnosti osmičtového 377. Jedná se o nejvyšší dosažitelnou postavu. Proto se všechny uzly synchronizují s sekundárním zdrojem.
5. Při pohledu na výstup ntpq pro uzel 0.2;
(0.2) ssh -x admin@10.64.18.164 '/usr/sbin/ntpq -p' remote refid st t when poll reach delay offset jitter ============================================================================== 128.xxx.xxx.xx .INIT. 16 u - 1024 0 0.000 0.000 4000.00 *avmtest1.emcvmw LOCAL(0) 9 u 54 256 377 0.085 -0.116 0.002 +avmtest2.emcvmw xx.xx.xx.xxx 10 u 56 256 377 0.090 0.073 0.012
Dozvíme se, že:
- Uzel 0.2 dotazuje test avmtest1 každých 256 sekund
- Uzel 0.2 se aktuálně synchronizuje se softwarem avmtest1.
- Avmtest1 je na úrovni 9, což znamená, že uzel 0.2 je ve fázi 10.
- Uzel 0.2 dotazuje test avmtest1 jednou za 256 sekund.
- Registr dostupnosti pro test avmtest1 je osmičtový 376.
- Hodiny v testu avmtest1 jsou 0,116 milisekund (nebo 116 mikrosekund) za hodinami v testu avmtest1.
- Kruhové zpoždění testu avmtest1 je 85 milisekund.
- Měření rozdílu latence v síti (kolísání) mezi uzlem 0.2 a avmtest1 je 2 milisekundy.
Konfigurace NTP (/etc/ntp.conf):
Při kontrole souboru /etc/ntp.conf v uzlu 0.2 odpovídá výše uvedenému výstupu ntpq .
#Customer premises / external time servers. # server xxx.xxx.xxx.xx <-- Primary time source (this is an external server located remote to the Avamar grid) # - - - - - # DPN time servers here and in the other module(s). # server xx.xx.xx.xxx <-- Secondary time source (this is the utility node) server xx.xx.xx.xxx <-- Tertiary time source (this is node 0.0)
Protokolování:
Protokolování NTP je směrováno do souboru /var/log/messages .
Chcete-li zobrazit protokolování související s protokolem NTP, grep obsah souboru /var/log/messages* pro "ntp"
Pokud u serveru Avamar dojde k problémům se synchronizací času, je nutné problém opravit. Řešení problémů se synchronizací času je nad rámec tohoto článku.
Pokud externí časový server nespočívá, jak je uvedeno výše, je přijatelné používat interní časový server. Interní čas se může z UTC pomalu posunovat, ale nejdůležitější je, že datové uzly jsou vzájemně synchronizované.
Nástroj Avamar asktime lze použít k výběru nových, preferovaných zdrojů času pro NTP.
Viz avamar: Jak nakonfigurovat protokol NTP na serveru Avamar pomocí asktime
Další informace:
http://support.microsoft.com/kb/939322 – Řadiče domény systému Windows by se neměly používat k zajištění dobrého času.
其他資訊
Příklad všech uzlů se synchronizovaným časem.
Poznámka: Příznak "--parallel" spustí příkaz v každém uzlu současně. V systému, kde je čas synchronizovaný, se zobrazí výstup podobný následujícímu
: Poznámka: Uzelnástroje (0.x) je nastaven na místní časové pásmo, v tomto příkladu "BST", zatímco datové uzly jsou nastaveny na časové pásmo "UTC". Jde o očekávané chování.
mapall --all --parallel 'date' Using /usr/local/avamar/var/probe.xml (0.s) ssh -x admin@xx.xx.xx.xxx 'date' (0.0) ssh -x admin@xx.xx.xx.xxx 'date' (0.1) ssh -x admin@xx.xx.xx.xxx 'date' (0.2) ssh -x admin@xx.xx.xx.xxx 'date' Mon Jun 20 12:01:12 BST 2011 Mon Jun 20 11:01:12 UTC 2011 Mon Jun 20 11:01:12 UTC 2011 Mon Jun 20 11:01:12 UTC 2011
PŘÍLOHA B:
Poznámka: Pokud k níže uvedenému příkazu přidáte příznak "n" (ntpq -pn), překlad ip adres se nepoužívá. Výstup se rychle vrátí a místo názvů hostitelů se zobrazí IP adresy. To má vliv na čitelnost výstupu.
mapall --all --noerror '/usr/sbin/ntpq -p' (0.s) ssh -x admin@10.xx.xx.xxx '/usr/sbin/ntpq -p' remote refid st t when poll reach delay offset jitter ============================================================================== 128.xxx.xxx.xx .INIT. 16 u - 1024 0 0.000 0.000 4000.00 *LOCAL(0) LOCAL(0) 8 l 8 64 377 0.000 0.000 0.001 (0.0) ssh -x admin@10.xx.xx.xxx '/usr/sbin/ntpq -p' remote refid st t when poll reach delay offset jitter ============================================================================== 128.xxx.xxx.xx .INIT. 16 u - 1024 0 0.000 0.000 4000.00 *avmtest1.emcvmw LOCAL(0) 9 u 750 1024 377 0.126 -0.197 0.001 (0.1) ssh -x admin@10.xx.xx.xxx '/usr/sbin/ntpq -p' remote refid st t when poll reach delay offset jitter ============================================================================== 128.xxx.xxx.xx .INIT. 16 u - 1024 0 0.000 0.000 4000.00 *avmtest1.emcvmw LOCAL(0) 9 u 194 256 377 0.095 -0.139 0.004 +avmtest2.emcvmw xx.xx.xx.xxx 10 u 189 256 377 0.097 0.062 0.005 (0.2) ssh -x admin@10.xx.xx.xxx '/usr/sbin/ntpq -p' remote refid st t when poll reach delay offset jitter ============================================================================== 128.xxx.xxx.xx .INIT. 16 u - 1024 0 0.000 0.000 4000.00 *avmtest1.emcvmw LOCAL(0) 9 u 54 256 377 0.085 -0.116 0.002 +avmtest2.emcvmw xx.xx.xx.xxx 10 u 56 256 377 0.090 0.073 0.012