Sådan afgør du, om et Avamar-system oplever et problem med tidssynkronisering (NTP).
摘要: Sådan finder du ud af, om et Avamar-system oplever et problem med en tidssynkronisering (NTP).
說明
Hvis noder i et Avamar-system ikke er tidssynkrone, kan vi forvente følgende adfærdstyper:
- Avamar-serveren kan ikke starte
- Noder skifter til offline
- HFScheck mislykkes med MSG_ERR_CGSAN_FAILED
- HFScheck mislykkes med MSG_ERR_HFSCHECKERRORS
- Kontrolpunkter mislykkedes
- Garbage Collection mislykkes
- Problemer med datakonsistens (hvis tiden ændrer sig under Garbage Collection)
Eksempler på fejlmeddelelser, der ofte rapporteres som følge af tab af tidssynkronisering:
-
samconn::checkallsucceed request failed DPNTIMECHECK=230
-
ALVORLIG FEJL: <0001> dpn-tidsuoverensstemmelse: synkroniser ure, og prøv igen
- ERROR: <0001> dpncheckmanager:verifyStartup cgsan gik uventet ud. afslutter
- ikke tilstrækkelige gyldige svar modtaget inden for tidsfrist
- Problemer med tidssynkroniseringsserveren (ntpd)
- Problemer med tidssynkroniseringsklienten
- Netværksproblemer
Denne artikel hjælper læseren med at afgøre, om Avamar-systemet oplever et problem med tidssynkronisering. Løsning af problemet ligger uden for denne artikels omfang.
Der er mange websteder, der dækker NTP-fejlfinding, og læseren opfordres til at undersøge dem. Nyttige URL-adresser på skrivetidspunktet er angivet i afsnittet "eksterne links".
Gør følgende for at fortsætte:
1. Log på Avamar-serveren som administrator i henhold til KB Avamar: Sådan logger du på en Avamar Server og indlæser forskellige taster.
2. For at afgøre, om Avamar-noder er synkroniseret tid, skal du kontrollere det aktuelle klokkeslæt og den aktuelle dato for hver node på Avamar-systemet. Se APPENDIKS A for eksempeloutput.
mapall --all --parallel '/bin/date'
Når alle noder rapporterer samme dato og klokkeslæt, betyder det, at tiden er fuldt synkroniseret mellem alle noderne på dette system.
3. For at holde tiden synkroniseret på noderne bruger Avamar NTP (Network Time Protocol). Linux-kommandoen "ntpq -pn" returnerer tilstanden for tidssynkronisering. Se APPENDIKS B for eksempeloutput.
mapall --all --noerror '/usr/sbin/ntpq -p'
4. Generelle Avamar Server-observationer:
- Alle noder er indstillet til at foretrække 128.xxx.xxx.xx som den primære tidskilde.
- Den sekundære tidskilde for alle noder er det lokale BIOS-ur på "avmtest1" (node 0.s).
- Den tertiære tidskilde er indstillet til avmtest2 (node 0.0), som selv refererer til avmtest1.
- Alle noder synkroniserer med avmtest1. Tidsserveren, der er markeret med en stjerne (*), er den, som noden aktuelt synkroniserer med.
- I dette tilfælde er 128.xxx.xxx.xx placeret eksternt. Den har en "reach"-værdi på 0 (kan ikke nås i øjeblikket). Det er ubrugeligt som tidskilde.
- avmtest1 og avmtest2 har begge et tilgængelighedsregister på 377 okt. Dette er det højeste tal, der kan nås. Derfor synkroniserer noderne alle med den sekundære kilde.
5. Se på ntpq-outputtet for node 0.2;
(0.2) ssh -x admin@10.64.18.164 '/usr/sbin/ntpq -p' remote refid st t when poll reach delay offset jitter ============================================================================== 128.xxx.xxx.xx .INIT. 16 u - 1024 0 0.000 0.000 4000.00 *avmtest1.emcvmw LOCAL(0) 9 u 54 256 377 0.085 -0.116 0.002 +avmtest2.emcvmw xx.xx.xx.xxx 10 u 56 256 377 0.090 0.073 0.012
Vi lærer, at:
- Node 0.2 poller avmtest1 hvert 256. sekund
- Node 0.2 synkroniseres i øjeblikket med avmtest1
- avmtest1 er atmodul 9, hvilket indikerer, at node 0.2 er atmodul 10.
- Node 0.2 poller avmtest1 én gang hvert 256. sekund.
- Tilgængelighedsregisteret for avmtest1 er 376 okt.
- Uret på avmtest1 er 0,116 millisekunder (eller 116 mikrosekunder) bag uret på avmtest1.
- Forsinkelsen på rundtur til avmtest1 er 85 millisekunder.
- Målingen af variansen i ventetid på netværket (ryster) mellem node 0.2 og avmtest1 er 2 millisekunder.
NTP-konfiguration (/etc/ntp.conf):
Hvis filen /etc/ntp.conf på node 0.2 gennemgås, svarer det til ntpq-outputtet ovenfor.
#Customer premises / external time servers. # server xxx.xxx.xxx.xx <-- Primary time source (this is an external server located remote to the Avamar grid) # - - - - - # DPN time servers here and in the other module(s). # server xx.xx.xx.xxx <-- Secondary time source (this is the utility node) server xx.xx.xx.xxx <-- Tertiary time source (this is node 0.0)
Logføring:
NTP-logføring dirigeres til /var/log/messages-filen .
Hvis du vil se NTP-relateret logføring, skal du grepe indholdet af /var/log/messages* for "ntp"
Hvis en Avamar oplever problemer med tidssynkronisering, skal problemet være løst. Løsning af problemer med tidssynkronisering ligger uden for denne artikels anvendelsesområde.
Hvis en ekstern tidsserver er upålidelig, som i eksemplet ovenfor, er det acceptabelt at bruge en intern tidsserver. Den interne tid kan afvige langsomt fra UTC, men den vigtigste overvejelse er, at datanoder synkroniseres med hinanden.
Avamar Utility Asktime-værktøjet kan bruges til at vælge nye, foretrukne tidskilder til NTP.
Se Avamar: Sådan konfigureres NTP på en Avamar Server ved hjælp af asktime
Yderligere oplysninger:
http://support.microsoft.com/kb/939322 - Windows domænecontrollere bør ikke anvendes til fungerende tid.
其他資訊
Eksempel på alle noder, der viser synkroniseret tid.
Bemærk: Det "-parallelle" flag kører kommandoen på hver node samtidigt. På et system, hvor tiden er synchroniz, ser du et output i stil med følgende:
Bemærk: The utility node (0.x) er indstillet til den lokale tidszone, i dette eksempel "BST", mens datanoderne er indstillet til tidszonen "UTC". Dette er forventeligt.
mapall --all --parallel 'date' Using /usr/local/avamar/var/probe.xml (0.s) ssh -x admin@xx.xx.xx.xxx 'date' (0.0) ssh -x admin@xx.xx.xx.xxx 'date' (0.1) ssh -x admin@xx.xx.xx.xxx 'date' (0.2) ssh -x admin@xx.xx.xx.xxx 'date' Mon Jun 20 12:01:12 BST 2011 Mon Jun 20 11:01:12 UTC 2011 Mon Jun 20 11:01:12 UTC 2011 Mon Jun 20 11:01:12 UTC 2011
BILAG B:
Bemærk: Hvis du føjer et "n"-flag til kommandoen nedenfor (ntpq -pn), bruges navnefortolkning ikke. Outputtet returneres hurtigt, og IP-adresser vises i stedet for værtsnavne. Dette påvirker outputtets læsbarhed.
mapall --all --noerror '/usr/sbin/ntpq -p' (0.s) ssh -x admin@10.xx.xx.xxx '/usr/sbin/ntpq -p' remote refid st t when poll reach delay offset jitter ============================================================================== 128.xxx.xxx.xx .INIT. 16 u - 1024 0 0.000 0.000 4000.00 *LOCAL(0) LOCAL(0) 8 l 8 64 377 0.000 0.000 0.001 (0.0) ssh -x admin@10.xx.xx.xxx '/usr/sbin/ntpq -p' remote refid st t when poll reach delay offset jitter ============================================================================== 128.xxx.xxx.xx .INIT. 16 u - 1024 0 0.000 0.000 4000.00 *avmtest1.emcvmw LOCAL(0) 9 u 750 1024 377 0.126 -0.197 0.001 (0.1) ssh -x admin@10.xx.xx.xxx '/usr/sbin/ntpq -p' remote refid st t when poll reach delay offset jitter ============================================================================== 128.xxx.xxx.xx .INIT. 16 u - 1024 0 0.000 0.000 4000.00 *avmtest1.emcvmw LOCAL(0) 9 u 194 256 377 0.095 -0.139 0.004 +avmtest2.emcvmw xx.xx.xx.xxx 10 u 189 256 377 0.097 0.062 0.005 (0.2) ssh -x admin@10.xx.xx.xxx '/usr/sbin/ntpq -p' remote refid st t when poll reach delay offset jitter ============================================================================== 128.xxx.xxx.xx .INIT. 16 u - 1024 0 0.000 0.000 4000.00 *avmtest1.emcvmw LOCAL(0) 9 u 54 256 377 0.085 -0.116 0.002 +avmtest2.emcvmw xx.xx.xx.xxx 10 u 56 256 377 0.090 0.073 0.012