Fastslå om et Avamar-system har et problem med tidssynkronisering (NTP).
摘要: Slik finner du ut om et Avamar-system har et problem med tidssynkronisering (NTP).
說明
Hvis noder i et Avamar-system ikke er tidssynkronisering, kan vi forvente følgende typer atferd:
- Avamar-serveren kan ikke starte
- Noder kobles fra
- HFS-kontroll mislykkes med MSG_ERR_CGSAN_FAILED
- HFS-kontroll mislykkes med MSG_ERR_HFSCHECKERRORS
- Kontrollpunkter mislykkes
- Datasanering mislykkes
- Problemer med datakonsekvens (hvis tiden endrer seg under datasanering)
Eksempler på feilmeldinger som vanligvis rapporteres som et resultat av tap av tidssynkronisering:
-
samconn::checkallsucceed request failed DPNTIMECHECK=230
-
UOPPRETTELIG FEIL: <0001> dpn-tidskonflikt: synkroniser klokker og prøv på nytt
- ERROR: <0001> dpncheckmanager::verifyStartup cgsan døde uventet. Avslutning
- ikke nok gyldige svar mottatt i tide
- Problemer med tidssynkroniseringsserveren (ntpd)
- Problemer med synkroniseringsklienten
- Nettverksproblemer
Denne artikkelen hjelper leseren med å avgjøre om Avamar-systemet har et problem med tidssynkronisering. Du kan løse problemet utenfor omfanget i denne artikkelen.
Det finnes mange nettsteder som dekker NTP-feilsøking, og leseren oppfordres til å undersøke dem. Nyttige nettbaserte URL-adresser som er tilgjengelige i skrivende stund, er oppført i delen «eksterne koblinger».
For å fortsette:
1. Logg på Avamar-serveren som administrator per KB Avamar: Slik logger du på en Avamar-server og laster inn ulike nøkler.
2. Kontroller gjeldende klokkeslett og dato for hver node på Avamar-systemet for å finne ut om Avamar-noder er tidssynkronisering. Se VEDLEGG A for eksempelutdata.
mapall --all --parallel '/bin/date'
Når alle noder rapporterer samme dato og klokkeslett, betyr dette at klokkeslettet er fullstendig synkronisert mellom alle nodene på dette systemet.
3. Avamar bruker NTP (Network Time Protocol) for å holde tiden synkronisert på nodene. Linux-kommandoen "ntpq -pn" returnerer tilstand for tidssynkronisering. Se APPENDIX B for eksempelutdata.
mapall --all --noerror '/usr/sbin/ntpq -p'
4. Generelle Avamar-serverobservasjoner:
- Alle noder er angitt til å foretrekke 128.xxx.xxx.xx som primær tidskilde.
- Den sekundære tidskilden for alle noder er den lokale BIOS-klokken på «avmtest1» (node 0.s).
- Tertiær tidskilde er satt til å være avmtest2 (node 0.0), som i seg selv refererer til avmtest1.
- Alle noder synkroniserer med avmtest1. Klokkeslettserveren som er merket med en stjerne (*), er den noden synkroniserer med for øyeblikket.
- I dette tilfellet er 128.xxx.xxx.xx plassert eksternt. Den har en "reach"-verdi på 0 (kan ikke nås for øyeblikket). Det er ubrukelig som tidskilde.
- avmtest1 og avmtest2 har begge et register over oktal 377. Dette er det høyeste tallet som kan oppnås. Derfor synkroniseres alle nodene med den sekundære kilden.
5. Se på ntpq-utdataene for node 0.2;
(0.2) ssh -x admin@10.64.18.164 '/usr/sbin/ntpq -p' remote refid st t when poll reach delay offset jitter ============================================================================== 128.xxx.xxx.xx .INIT. 16 u - 1024 0 0.000 0.000 4000.00 *avmtest1.emcvmw LOCAL(0) 9 u 54 256 377 0.085 -0.116 0.002 +avmtest2.emcvmw xx.xx.xx.xxx 10 u 56 256 377 0.090 0.073 0.012
Vi lærer at:
- Node 0.2 avspørrer avmtest1 hvert 256. sekund
- Node 0.2 synkroniseres for øyeblikket med avmtest1
- avmtest1 er på stratum 9, noe som tyder på at node 0.2 er på stratum 10.
- Node 0.2 avspørrer avmtest1 én gang hvert 256. sekund.
- Tilgjengelighetsregisteret for avmtest1 er oktal 376.
- Klokken på avmtest1 er 0,116 millisekunder (eller 116 mikrosekunder) bak klokken på avmtest1.
- Rundturforsinkelsen til avmtest1 er 85 millisekunder.
- Målingen av variansen i ventetiden på nettverket (jitter) mellom node 0.2 og avmtest1 er 2 millisekunder.
NTP-konfigurasjon (/etc/ntp.conf):
Hvis du går gjennom filen /etc/ntp.conf på node 0.2, samsvarer den med ntpq-utdataene ovenfor.
#Customer premises / external time servers. # server xxx.xxx.xxx.xx <-- Primary time source (this is an external server located remote to the Avamar grid) # - - - - - # DPN time servers here and in the other module(s). # server xx.xx.xx.xxx <-- Secondary time source (this is the utility node) server xx.xx.xx.xxx <-- Tertiary time source (this is node 0.0)
Logging:
NTP-logging sendes til filen /var/log/messages .
Hvis du vil vise NTP-relatert logging, grep du innholdet i /var/log/messages* for "ntp"
Hvis en Avamar opplever problemer med tidssynkronisering, må problemet løses. Løsning på problemer med tidssynkronisering er utenfor omfanget i denne artikkelen.
Hvis en ekstern tidsserver er upålitelig, som i eksemplet ovenfor, er det akseptabelt å bruke en intern tidsserver. Den interne tiden kan gå sakte fra UTC, men det viktigste hensynet er at datanodene synkroniseres med hverandre.
Avamar Utility Asktime Tool kan brukes til å velge nye, foretrukne tidskilder for NTP.
Se Avamar: Slik konfigurerer du NTP på en Avamar-server ved hjelp av spørretid
Tilleggsinformasjon:
http://support.microsoft.com/kb/939322 – Windows-domenekontrollere bør ikke brukes for god tid å beholde.
其他資訊
Eksempel på alle noder som viser synkronisert tid.
Merk: «--parallell»-flagget kjører kommandoen på hver node samtidig. På et system der klokkeslettet synkroniseres, vil du se utdata som ligner på følgende:
Merk: Verktøyetsnode (0.x) er satt til den lokale tidssonen, i dette eksempelet "DLL", mens datanodene er satt til "UTC"-tidssonen. Dette er forventet atferd.
mapall --all --parallel 'date' Using /usr/local/avamar/var/probe.xml (0.s) ssh -x admin@xx.xx.xx.xxx 'date' (0.0) ssh -x admin@xx.xx.xx.xxx 'date' (0.1) ssh -x admin@xx.xx.xx.xxx 'date' (0.2) ssh -x admin@xx.xx.xx.xxx 'date' Mon Jun 20 12:01:12 BST 2011 Mon Jun 20 11:01:12 UTC 2011 Mon Jun 20 11:01:12 UTC 2011 Mon Jun 20 11:01:12 UTC 2011
VEDLEGG B:
Merk: Hvis du legger til et n-flagg i kommandoen nedenfor (ntpq -pn), brukes ikke navneløsing. Utdata returneres raskt, og IP-adresser vises i stedet for vertsnavn. Dette påvirker lesbarheten til utdataene.
mapall --all --noerror '/usr/sbin/ntpq -p' (0.s) ssh -x admin@10.xx.xx.xxx '/usr/sbin/ntpq -p' remote refid st t when poll reach delay offset jitter ============================================================================== 128.xxx.xxx.xx .INIT. 16 u - 1024 0 0.000 0.000 4000.00 *LOCAL(0) LOCAL(0) 8 l 8 64 377 0.000 0.000 0.001 (0.0) ssh -x admin@10.xx.xx.xxx '/usr/sbin/ntpq -p' remote refid st t when poll reach delay offset jitter ============================================================================== 128.xxx.xxx.xx .INIT. 16 u - 1024 0 0.000 0.000 4000.00 *avmtest1.emcvmw LOCAL(0) 9 u 750 1024 377 0.126 -0.197 0.001 (0.1) ssh -x admin@10.xx.xx.xxx '/usr/sbin/ntpq -p' remote refid st t when poll reach delay offset jitter ============================================================================== 128.xxx.xxx.xx .INIT. 16 u - 1024 0 0.000 0.000 4000.00 *avmtest1.emcvmw LOCAL(0) 9 u 194 256 377 0.095 -0.139 0.004 +avmtest2.emcvmw xx.xx.xx.xxx 10 u 189 256 377 0.097 0.062 0.005 (0.2) ssh -x admin@10.xx.xx.xxx '/usr/sbin/ntpq -p' remote refid st t when poll reach delay offset jitter ============================================================================== 128.xxx.xxx.xx .INIT. 16 u - 1024 0 0.000 0.000 4000.00 *avmtest1.emcvmw LOCAL(0) 9 u 54 256 377 0.085 -0.116 0.002 +avmtest2.emcvmw xx.xx.xx.xxx 10 u 56 256 377 0.090 0.073 0.012