Bepalen of een Avamar-systeem een NTP-probleem (Tijdsynchronisatie) ondervindt.
摘要: Bepalen of een Avamar-systeem een NTP-probleem (tijdsynchronisatie) ondervindt.
說明
Als knooppunten binnen een Avamar-systeem niet worden gesynchroniseerd, kunnen we de volgende typen gedrag verwachten:
- De Avamar-server kan niet worden gestart
- Knooppunten gaan offline
- HFScheck mislukt met MSG_ERR_CGSAN_FAILED
- HFScheck mislukt met MSG_ERR_HFSCHECKERRORS
- Checkpoints mislukken
- Garbage Collection mislukt
- Problemen met dataconsistentie (als de tijd verandert tijdens garbage collection)
Voorbeelden van foutmeldingen die vaak worden gerapporteerd als gevolg van tijdsynchronisatieverlies:
-
samconn::checkallsucceed request failed DPNTIMECHECK=230
-
FATALE FOUT: <0001> dpn tijdsfout: synchroniseer klokken en probeer het opnieuw
- ERROR: <0001> dpncheckmanager::verifyStartup cgsan is onverwachts omgekomen. beëindigd
- niet voldoende geldige antwoorden die op tijd zijn ontvangen
- Problemen met de tijdsynchronisatieserver (ntpd)
- Problemen met de tijdsynchronisatieclient
- Netwerkproblemen
Dit artikel helpt de lezer te bepalen of het Avamar systeem een tijdsynchronisatieprobleem ondervindt. Het oplossen van het probleem valt buiten het toepassingsgebied van dit artikel.
Er zijn veel websites die NTP-probleemoplossing behandelen en de lezer wordt aangemoedigd deze te onderzoeken. Nuttige web-URL's die beschikbaar zijn op het moment van schrijven worden vermeld in het gedeelte 'externe koppelingen'.
Ga als volgt te werk:
1. Meld u aan bij de Avamar-server als beheerder volgens KB Avamar: Aanmelden bij een Avamar server en verschillende sleutels laden.
2. Om te bepalen of Avamar knooppunten tijd gesynchroniseerd zijn, controleert u de huidige tijd en datum van elk knooppunt op het Avamar systeem. Zie BIJLAGE A voor uitvoervoorbeelden.
mapall --all --parallel '/bin/date'
Wanneer alle knooppunten dezelfde datum en tijd rapporteren, betekent dit dat de tijd volledig is gesynchroniseerd tussen alle knooppunten op dit systeem.
3. Om de tijd gesynchroniseerd te houden op de knooppunten, gebruikt Avamar Network Time Protocol (NTP). De Linux-opdracht 'ntpq -pn' retourneert de tijdsynchronisatie. Zie BIJLAGE B voor uitvoervoorbeelden.
mapall --all --noerror '/usr/sbin/ntpq -p'
4. Algemene Avamar serverobservaties:
- Alle knooppunten hebben de voorkeur boven 128.xxx.xxx.xx als primaire tijdbron.
- De secundaire tijdbron voor alle knooppunten is de lokale BIOS-klok op "avmtest1" (knooppunt 0.s).
- De tertiaire tijdbron is ingesteld op avmtest2 (knooppunt 0.0) die zelf verwijst naar avmtest1.
- Alle knooppunten synchroniseren met avmtest1. De tijdserver die is gemarkeerd met een sterretje (*) is de tijdserver waarmee het knooppunt momenteel synchroniseert.
- In dit geval bevindt 128.xxx.xxx.xx zich op afstand. Het heeft een 'bereik'-waarde van 0 (momenteel onbereikbaar). Het is onbruikbaar als tijdbron.
- avmtest1 en avmtest2 hebben beide een bereikbaarheidsregister van octal 377. Dit is het hoogst haalbare cijfer. Daarom synchroniseren de knooppunten allemaal met de secundaire bron.
5. De ntpq-uitvoer voor knooppunt 0.2 bekijken;
(0.2) ssh -x admin@10.64.18.164 '/usr/sbin/ntpq -p' remote refid st t when poll reach delay offset jitter ============================================================================== 128.xxx.xxx.xx .INIT. 16 u - 1024 0 0.000 0.000 4000.00 *avmtest1.emcvmw LOCAL(0) 9 u 54 256 377 0.085 -0.116 0.002 +avmtest2.emcvmw xx.xx.xx.xxx 10 u 56 256 377 0.090 0.073 0.012
We leren dat:
- Knooppunt 0.2 polling avmtest1 elke 256 seconden
- Knooppunt 0.2 synchroniseert momenteel met avmtest1
- avmtest1 bevindt zich in stratum 9, wat betekent dat knooppunt 0.2 zich in stratum 10 bevindt.
- Knooppunt 0.2 pollt avmtest1 eenmaal per 256 seconden.
- Het bereiksregister voor avmtest1 is octal 376.
- De klok op avmtest1 is 0,116 milliseconden (of 116 microseconden) achter de klok op avmtest1.
- De roundtrip-vertraging naar avmtest1 is 85 milliseconden.
- De meting van de variance in latentie op het netwerk (jitter) tussen knooppunt 0.2 en avmtest1 is 2 milliseconden.
NTP-configuratie (/etc/ntp.conf):
Als u het bestand /etc/ntp.conf op knooppunt 0.2 bekijkt, komt het overeen met de ntpq-uitvoer hierboven.
#Customer premises / external time servers. # server xxx.xxx.xxx.xx <-- Primary time source (this is an external server located remote to the Avamar grid) # - - - - - # DPN time servers here and in the other module(s). # server xx.xx.xx.xxx <-- Secondary time source (this is the utility node) server xx.xx.xx.xxx <-- Tertiary time source (this is node 0.0)
Logboekregistratie:
NTP-logboekregistratie wordt doorgeleid naar het bestand /var/log/messages .
Om NTP-logboekregistratie weer te geven, grept u de inhoud van /var/log/messages* voor 'ntp'
Als een Avamar tijdsynchronisatieproblemen ondervindt, moet het probleem worden opgelost. Het oplossen van tijdsynchronisatieproblemen valt buiten het toepassingsgebied van dit artikel.
Als een externe tijdserver onbetrouwbaar is, zoals in het bovenstaande voorbeeld, is het aanvaardbaar om een interne tijdserver te gebruiken. De interne tijd kan langzaam afwijken van UTC, maar het belangrijkste aspect is dat dataknooppunten tijd met elkaar worden gesynchroniseerd.
De Avamar utility asktime tool kan worden gebruikt om nieuwe, voorkeurstijdbronnen voor NTP te selecteren.
Zie Avamar: NTP configureren op een Avamar server met behulp van asktime
Aanvullende informatie:
http://support.microsoft.com/kb/939322 - Windows-domeincontrollers mogen niet worden gebruikt voor een goede bewaartijd.
其他資訊
Voorbeeld van alle knooppunten met gesynchroniseerde tijd.
Opmerking: De vlag '--parallel' voert de opdracht tegelijkertijd uit op elk knooppunt. Op een systeem waarop de tijd wordtgesynchroniseerd, ziet u een uitvoer die vergelijkbaar is met de volgende:
Opmerking: Hetutility-knooppunt (0.x) is ingesteld op de lokale tijdzone, in dit voorbeeld 'BST' terwijl de dataknooppunten zijn ingesteld op de tijdzone 'UTC'. Dit is normaal gedrag.
mapall --all --parallel 'date' Using /usr/local/avamar/var/probe.xml (0.s) ssh -x admin@xx.xx.xx.xxx 'date' (0.0) ssh -x admin@xx.xx.xx.xxx 'date' (0.1) ssh -x admin@xx.xx.xx.xxx 'date' (0.2) ssh -x admin@xx.xx.xx.xxx 'date' Mon Jun 20 12:01:12 BST 2011 Mon Jun 20 11:01:12 UTC 2011 Mon Jun 20 11:01:12 UTC 2011 Mon Jun 20 11:01:12 UTC 2011
BIJLAGE B:
Opmerking: Als u een 'n'-vlag toevoegt aan de onderstaande opdracht (ntpq -pn), wordt de naamresolutie niet gebruikt. De uitvoer wordt snel geretourneerd en IP-adressen worden weergegeven in plaats van hostnamen. Dit is van invloed op de leesbaarheid van de uitvoer.
mapall --all --noerror '/usr/sbin/ntpq -p' (0.s) ssh -x admin@10.xx.xx.xxx '/usr/sbin/ntpq -p' remote refid st t when poll reach delay offset jitter ============================================================================== 128.xxx.xxx.xx .INIT. 16 u - 1024 0 0.000 0.000 4000.00 *LOCAL(0) LOCAL(0) 8 l 8 64 377 0.000 0.000 0.001 (0.0) ssh -x admin@10.xx.xx.xxx '/usr/sbin/ntpq -p' remote refid st t when poll reach delay offset jitter ============================================================================== 128.xxx.xxx.xx .INIT. 16 u - 1024 0 0.000 0.000 4000.00 *avmtest1.emcvmw LOCAL(0) 9 u 750 1024 377 0.126 -0.197 0.001 (0.1) ssh -x admin@10.xx.xx.xxx '/usr/sbin/ntpq -p' remote refid st t when poll reach delay offset jitter ============================================================================== 128.xxx.xxx.xx .INIT. 16 u - 1024 0 0.000 0.000 4000.00 *avmtest1.emcvmw LOCAL(0) 9 u 194 256 377 0.095 -0.139 0.004 +avmtest2.emcvmw xx.xx.xx.xxx 10 u 189 256 377 0.097 0.062 0.005 (0.2) ssh -x admin@10.xx.xx.xxx '/usr/sbin/ntpq -p' remote refid st t when poll reach delay offset jitter ============================================================================== 128.xxx.xxx.xx .INIT. 16 u - 1024 0 0.000 0.000 4000.00 *avmtest1.emcvmw LOCAL(0) 9 u 54 256 377 0.085 -0.116 0.002 +avmtest2.emcvmw xx.xx.xx.xxx 10 u 56 256 377 0.090 0.073 0.012