Визначення того, чи має система Avamar проблему синхронізації часу (NTP).
摘要: Як визначити, чи має система Avamar проблему синхронізації часу (NTP).
說明
Якщо вузли в системі Avamar не синхронізовані за часом, ми можемо очікувати наступних типів поведінки:
- Сервер Avamar не може запуститися
- Вузли переходять в автономний режим
- HFScheck завершує роботу з MSG_ERR_CGSAN_FAILED
- HFScheck зазнає невдачі з MSG_ERR_HFSCHECKERRORS
- Контрольні точки виходять з ладу
- Збір сміття не вдається
- Проблеми з узгодженістю даних (якщо час змінюється під час вивезення сміття)
Приклади повідомлень про помилки, які зазвичай повідомляються в результаті втрати синхронізації часу:
-
samconn::checkallsucceed запит не вдався DPNTIMECHECK=230
-
ФАТАЛЬНА ПОМИЛКА: <0001> Невідповідність часу DPN: синхронізація годинників і повторна спроба
- ПОМИЛКА: <0001> dpncheckmanager::verifyStartup cgsan несподівано помер. Припинення дії
- недостатня кількість обґрунтованих відповідей, отриманих вчасно
- Проблеми з сервером синхронізації часу (ntpd)
- Проблеми з клієнтом синхронізації часу
- Проблеми з мережею
Ця стаття допомагає читачеві визначити, чи має система Avamar проблему синхронізації часу. Вирішення питання виходить за рамки цієї статті.
Існує багато веб-сайтів, які висвітлюють усунення несправностей NTP, і читачеві рекомендується дослідити їх. Корисні URL-адреси, доступні на момент написання статті, перелічені в розділі
"зовнішні посилання".Щоб продовжити:
1. Увійдіть на сервер Avamar як адміністратор за KB Avamar: Як увійти на сервер Avamar і завантажити різні ключі.
2. Щоб визначити, чи синхронізовані за часом вузли Avamar, перевірте поточний час і дату кожного вузла в системі Avamar. Дивись ДОДАТОК А для виведення зразків.
mapall --all --parallel '/bin/date'
Коли всі вузли повідомляють про одну і ту ж дату і час, це означає, що час повністю синхронізовано між усіма вузлами в цій системі.
3. Для синхронізації часу на вузлах Avamar використовує протокол мережевого часу (NTP). Команда Linux "ntpq -pn" повертає стан синхронізації часу. Дивись ДОДАТОК B для виведення зразків.
mapall --all --noerror '/usr/sbin/ntpq -p'
4. Загальні спостереження за сервером Avamar:
- Усі вузли налаштовані так, щоб віддавати перевагу 128.xxx.xxx.xx як основному джерелу часу.
- Вторинним джерелом часу для всіх вузлів є локальний годинник BIOS на "avmtest1" (вузол 0.s).
- Джерелом третинного часу встановлено значення avmtest2 (вузол 0.0), що саме по собі посилається на avmtest1.
- Всі вузли синхронізуються з avmtest1. Сервер часу, позначений зірочкою (*), - це той, з яким вузол в даний момент синхронізується.
- У цьому випадку 128.xxx.xxx.xx знаходиться віддалено. Він має значення 'reach' 0 (наразі недосяжний). Як джерело часу він марний.
- AVMtest1 і AVMtest2 мають регістр досяжності вісімкове число 377. Це найвищий досяжний показник. Тому всі вузли синхронізуються з вторинним джерелом.
5. Дивлячись на вихід ntpq для вузла 0.2;
(0.2) ssh -x admin@10.64.18.164 '/usr/sbin/ntpq -p' remote refid st t when poll reach delay offset jitter ============================================================================== 128.xxx.xxx.xx .INIT. 16 u - 1024 0 0.000 0.000 4000.00 *avmtest1.emcvmw LOCAL(0) 9 u 54 256 377 0.085 -0.116 0.002 +avmtest2.emcvmw xx.xx.xx.xxx 10 u 56 256 377 0.090 0.073 0.012
Ми дізнаємося, що:
- Вузол 0.2 опитує avmtest1 кожні 256 секунд
- Node 0.2 наразі синхронізується з avmtest1
- AVMtest1 знаходиться в страті 9, маючи на увазі, що вузол 0.2 знаходиться в страті 10.
- Вузол 0.2 опитує avmtest1 раз на 256 секунд.
- Регістр досяжності для avmtest1 становить вісімкове число 376.
- Годинник на avmtest1 відстає від годинника на avmtest1 на 0,116 мілісекунди (або 116 мікросекунд).
- Затримка в обидві сторони до avmtest1 становить 85 мілісекунд.
- Вимірювання дисперсії затримки в мережі (джиттера) між вузлом 0.2 і avmtest1 становить 2 мілісекунди.
Конфігурація NTP (/etc/ntp.conf):
Якщо ви переглядаєте файл /etc/ntp.conf на вузлі 0.2, він відповідає наведеному вище виводу ntpq.
#Customer premises / external time servers. # server xxx.xxx.xxx.xx <-- Primary time source (this is an external server located remote to the Avamar grid) # - - - - - # DPN time servers here and in the other module(s). # server xx.xx.xx.xxx <-- Secondary time source (this is the utility node) server xx.xx.xx.xxx <-- Tertiary time source (this is node 0.0)
Журналювання:
Ведення журналу NTP спрямовується до файла / var/log/messages .
Щоб переглянути журналювання, пов'язане з NTP, перегляньте вміст /var/ log/messages* для ' ntp'
Якщо у Avamar виникають проблеми із синхронізацією часу, проблему необхідно виправити. Вирішення проблем синхронізації часу виходить за рамки цієї статті.
Якщо зовнішній сервер часу є ненадійним, як у наведеному вище прикладі, допустимо використовувати внутрішній сервер часу. Внутрішній час може повільно зміщуватися від UTC, але найважливішим фактором є те, що вузли даних синхронізовані за часом один з одним.
Утиліта Avamar asktime може бути використана для вибору нових, бажаних джерел часу для NTP.
Дивіться Avamar: Як налаштувати NTP на сервері Avamar за допомогою asktime
Додаткова інформація:
http://support.microsoft.com/kb/939322 - Контролери домену Windows не слід використовувати для належного відліку часу.
其他資訊
Приклад всіх вузлів, що показують синхронізований час.
Примітка: Прапорець '--parallel' запускає команду на кожному вузлі одночасно. У системі, де час синхронізовано, ви бачите результат, подібний до наступного:Примітка:
Допоміжнийвузол (0.x) встановлюється в місцевий часовий пояс, в даному прикладі «BST», тоді як вузли даних встановлюються в часовий пояс «UTC». Це очікувана поведінка.
mapall --all --parallel 'date' Using /usr/local/avamar/var/probe.xml (0.s) ssh -x admin@xx.xx.xx.xxx 'date' (0.0) ssh -x admin@xx.xx.xx.xxx 'date' (0.1) ssh -x admin@xx.xx.xx.xxx 'date' (0.2) ssh -x admin@xx.xx.xx.xxx 'date' Mon Jun 20 12:01:12 BST 2011 Mon Jun 20 11:01:12 UTC 2011 Mon Jun 20 11:01:12 UTC 2011 Mon Jun 20 11:01:12 UTC 2011
ДОДАТОК Б:
Якщо до наведеної нижче команди додається прапорець 'n' (ntpq -pn), роздільна здатність назв не використовується. Виведені дані повертаються швидко, а замість назв вузлів буде показано IP-адреси. Це впливає на читабельність виведених даних.
mapall --all --noerror '/usr/sbin/ntpq -p' (0.s) ssh -x admin@10.xx.xx.xxx '/usr/sbin/ntpq -p' remote refid st t when poll reach delay offset jitter ============================================================================== 128.xxx.xxx.xx .INIT. 16 u - 1024 0 0.000 0.000 4000.00 *LOCAL(0) LOCAL(0) 8 l 8 64 377 0.000 0.000 0.001 (0.0) ssh -x admin@10.xx.xx.xxx '/usr/sbin/ntpq -p' remote refid st t when poll reach delay offset jitter ============================================================================== 128.xxx.xxx.xx .INIT. 16 u - 1024 0 0.000 0.000 4000.00 *avmtest1.emcvmw LOCAL(0) 9 u 750 1024 377 0.126 -0.197 0.001 (0.1) ssh -x admin@10.xx.xx.xxx '/usr/sbin/ntpq -p' remote refid st t when poll reach delay offset jitter ============================================================================== 128.xxx.xxx.xx .INIT. 16 u - 1024 0 0.000 0.000 4000.00 *avmtest1.emcvmw LOCAL(0) 9 u 194 256 377 0.095 -0.139 0.004 +avmtest2.emcvmw xx.xx.xx.xxx 10 u 189 256 377 0.097 0.062 0.005 (0.2) ssh -x admin@10.xx.xx.xxx '/usr/sbin/ntpq -p' remote refid st t when poll reach delay offset jitter ============================================================================== 128.xxx.xxx.xx .INIT. 16 u - 1024 0 0.000 0.000 4000.00 *avmtest1.emcvmw LOCAL(0) 9 u 54 256 377 0.085 -0.116 0.002 +avmtest2.emcvmw xx.xx.xx.xxx 10 u 56 256 377 0.090 0.073 0.012