AvamarシステムでNTP(時刻同期)の問題が発生しているかどうかを判断します。
摘要: AvamarシステムでNTP(時刻同期)の問題が発生しているかどうかを確認する方法。
說明
Avamarシステム内のノードが時間同期されていない場合は、次のタイプの動作が期待できます。
- Avamarサーバーを起動できない
- ノードがオフラインになる
- HFScheckがMSG_ERR_CGSAN_FAILEDで失敗する
- HFScheckがMSG_ERR_HFSCHECKERRORSで失敗する
- チェックポイントが失敗する
- ガベージ コレクションが失敗する
- データの整合性の問題(ガベージ コレクション中に時間が変更された場合)
時間同期の損失の結果として一般的に報告されるエラー メッセージの例:
-
samconn::checkallsucceed request failed DPNTIMECHECK=230
-
致命的エラー: <0001> dpn time mismatch:クロックの同期と再試行
- ERROR: <0001> dpncheckmanager::verifyStartup cgsanが予期せず停止しました。 終了
- 時間内に受け取った有効な応答が十分ではない
- 時刻同期(ntpd)サーバーに関する問題
- 時刻同期クライアントに関する問題
- ネットワークの問題
この記事では、Avamarシステムで時刻同期の問題が発生しているかどうかを読者が判断するのに役立ちます。この問題の解決は、この文書の範囲外です。
NTPのトラブルシューティングをカバーする多くのWebサイトがあり、リーダーはそれらを調査することをお勧めします。執筆時点で利用可能な役に立つWeb URLは、「外部リンク」セクションにリストされています。
続行するには、次の手順を実行します。
1.KB Avamarに従って、Avamarサーバーにadminとしてログインします。Avamarサーバーにログインし、さまざまなキーをロードする方法..
2.Avamarノードが時刻同期されているかどうかを確認するには、Avamarシステム上の各ノードの現在の時刻と日付を確認します。出力例については 、「付録A 」を参照してください。
mapall --all --parallel '/bin/date'
すべてのノードが同じ日付と時刻をレポートする場合、時刻はこのシステム上のすべてのノード間で完全に同期されることを意味します。
3.ノードで時間を同期させるために、AvamarはNTP(Network Time Protocol)を使用します。Linuxコマンド「ntpq -pn」は、時刻同期の状態を返します。出力例については 、付録B を参照してください。
mapall --all --noerror '/usr/sbin/ntpq -p'
4.Avamarサーバーの一般的な観察結果:
- すべてのノードは、プライマリ タイム ソースとして128.xxx.xxx.xxを優先するように設定されています。
- すべてのノードのセカンダリ タイム ソースは、「avmtest1」(ノード0.s)のローカルBIOSクロックです。
- 第3のタイム ソースは、avmtest1を参照するavmtest2(ノード0.0)に設定されます。
- すべてのノードがavmtest1と同期しています。アスタリスク(*)が付いているタイム サーバーは、ノードが現在同期しているサーバーです。
- この場合、128.xxx.xxx.xxはリモートにあります。「reach」値は0(現在到達不能)です。タイム ソースとしては役に立ちません。
- avmtest1とavmtest2の両方の到達可能性レジスタは8進数377です。これは達成可能な最高の数字です。したがって、ノードはすべてセカンダリ ソースと同期しています。
5.ノード0.2の ntpq 出力を確認します。
(0.2) ssh -x admin@10.64.18.164 '/usr/sbin/ntpq -p' remote refid st t when poll reach delay offset jitter ============================================================================== 128.xxx.xxx.xx .INIT. 16 u - 1024 0 0.000 0.000 4000.00 *avmtest1.emcvmw LOCAL(0) 9 u 54 256 377 0.085 -0.116 0.002 +avmtest2.emcvmw xx.xx.xx.xxx 10 u 56 256 377 0.090 0.073 0.012
次のことが分かっています。
- ノード0.2が256秒ごとにavmtest1をポーリングしている
- ノード0.2は現在、avmtest1と同期しています
- avmtest1は階層9に存在し、ノード0.2が階層10にあることを意味します。
- ノード0.2は、avmtest1を256秒ごとに1回ポーリングしています。
- avmtest1の到達可能性登録は、8進数376です。
- avmtest1のクロックは、avmtest1のクロックの背後にある0.116ミリ秒(または116マイクロ秒)です。
- avmtest1へのラウンドトリップ遅延は85ミリ秒です。
- ノード0.2とavmtest1の間のネットワーク上のレイテンシ(ジッター)の分散の測定値は2ミリ秒です。
NTP構成(/etc/ntp.conf):
ノード 0.2の/etc/ntp.conf ファイルを確認すると、前述の ntpq 出力に対応します。
#Customer premises / external time servers. # server xxx.xxx.xxx.xx <-- Primary time source (this is an external server located remote to the Avamar grid) # - - - - - # DPN time servers here and in the other module(s). # server xx.xx.xx.xxx <-- Secondary time source (this is the utility node) server xx.xx.xx.xxx <-- Tertiary time source (this is node 0.0)
ログ:
NTPログは、/var/log/messagesファイルに送られます。
NTP関連のログを表示するには、「ntp」の/var/log/messages*の内容をgrepします。
Avamarで時刻同期の問題が発生した場合は、問題を修正する必要があります。時刻同期の問題の解決については、この文書では説明しません。
前述の例のように、外部タイム サーバーの信頼性が低い場合は、内部タイム サーバーを使用しても問題ありません。内部の時刻はUTCからゆっくりとずれますが、最も重要な考慮事項は、データ ノードが互いに時間を同期していることです。
Avamarユーティリティの asktime ツールを使用して、NTPの新しい優先時間ソースを選択できます。
Avamarを参照してください。asktime
を使用してAvamarサーバーでNTPを構成する方法追加情報:
http://support.microsoft.com/kb/939322 - Windowsドメイン コントローラーは、適切な時間を維持するために使用しないでください。
其他資訊
同期時間を示すすべてのノードの例。
注:「--parallel」フラグは、各ノードでコマンドを同時に実行します。時刻が同期されているシステムでは、次のような出力が表示されます。
注: ユーティリティー ノード(0.x)はローカル タイム ゾーンに設定されています。この例では「BST」ですが、データ ノードは「UTC」タイム ゾーンに設定されています。これは正常な動作です。
mapall --all --parallel 'date' Using /usr/local/avamar/var/probe.xml (0.s) ssh -x admin@xx.xx.xx.xxx 'date' (0.0) ssh -x admin@xx.xx.xx.xxx 'date' (0.1) ssh -x admin@xx.xx.xx.xxx 'date' (0.2) ssh -x admin@xx.xx.xx.xxx 'date' Mon Jun 20 12:01:12 BST 2011 Mon Jun 20 11:01:12 UTC 2011 Mon Jun 20 11:01:12 UTC 2011 Mon Jun 20 11:01:12 UTC 2011
付録B:
注: 以下のコマンド(ntpq -pn)に「n」フラグを追加する場合、名前解決は使用されません。出力が迅速に返され、ホスト名の代わりにIPアドレスが表示されます。これは、出力の読みやすさに影響します。
mapall --all --noerror '/usr/sbin/ntpq -p' (0.s) ssh -x admin@10.xx.xx.xxx '/usr/sbin/ntpq -p' remote refid st t when poll reach delay offset jitter ============================================================================== 128.xxx.xxx.xx .INIT. 16 u - 1024 0 0.000 0.000 4000.00 *LOCAL(0) LOCAL(0) 8 l 8 64 377 0.000 0.000 0.001 (0.0) ssh -x admin@10.xx.xx.xxx '/usr/sbin/ntpq -p' remote refid st t when poll reach delay offset jitter ============================================================================== 128.xxx.xxx.xx .INIT. 16 u - 1024 0 0.000 0.000 4000.00 *avmtest1.emcvmw LOCAL(0) 9 u 750 1024 377 0.126 -0.197 0.001 (0.1) ssh -x admin@10.xx.xx.xxx '/usr/sbin/ntpq -p' remote refid st t when poll reach delay offset jitter ============================================================================== 128.xxx.xxx.xx .INIT. 16 u - 1024 0 0.000 0.000 4000.00 *avmtest1.emcvmw LOCAL(0) 9 u 194 256 377 0.095 -0.139 0.004 +avmtest2.emcvmw xx.xx.xx.xxx 10 u 189 256 377 0.097 0.062 0.005 (0.2) ssh -x admin@10.xx.xx.xxx '/usr/sbin/ntpq -p' remote refid st t when poll reach delay offset jitter ============================================================================== 128.xxx.xxx.xx .INIT. 16 u - 1024 0 0.000 0.000 4000.00 *avmtest1.emcvmw LOCAL(0) 9 u 54 256 377 0.085 -0.116 0.002 +avmtest2.emcvmw xx.xx.xx.xxx 10 u 56 256 377 0.090 0.073 0.012