Avamarチェックポイントは、Avamarデータ ノード上の読み取り専用ディレクトリーのセットです。
これは、Avamarシステムのポイント イン タイム スナップショットのようなものです。Avamarシステムで修正できない重大な問題が発生した場合は、ロールバックの目的で役立つ場合があります。
cplistツールは、Avamarシステム上に存在するチェックポイントのリストを作成します。
このツールは、Avamarユーティリティー ノードにアクセスできるすべてのユーザーが実行できます。
問題が発生している、またはメンテナンス中のシステムで続行する方法を決定する前に、どのチェックポイントとその状態が存在するかを理解することが重要です。
チェックポイントの状態に関する想定が正しくないと、データ消失や回復不能なAvamarシステムが発生する可能性があります。
この文書は、読者がツールの出力を解釈するのに役立ちます。
コマンドcplistからの出力例を次に示します。
cp.20130915110057 Sun Sep 15 12:00:57 2013 valid rol --- nodes 3/3 stripes 3530
cp.20130915110654 Sun Sep 15 12:06:54 2013 valid --- --- nodes 3/3 stripes 3530
上の最初のチェックポイントを見て、各データ フィールドの意味について説明します。
チェックポイント タグ名 - cp.20130915110057
- これはチェックポイントの識別タグであり、チェックポイントが開始された時刻に対応します。Cp。YYYYMMDDHHMMSS
- Avamar v7.1からは、チェックポイントの開始日時でタグ付けされるのではなく、シリアル番号でチェックポイントが割り当てられます。
所要時間 : 9月15日日曜日12:00:57
- チェックポイントが作成された日付、時刻。これは常にチェックポイント タグに対応します。
Validity - valid
- このフィールドに「valid」と表示されている場合、チェックポイントは「健全」です。
- Validity は、チェックポイントがロールバックの目的で役立つかどうかを示します。
- このフィールドに「valid」と表示されている場合、チェックポイントがHFScheck検証を受けたという意味ではありません。
- デフォルトではコマンドに使用可能なチェックポイントが表示されるため、「cplist」を実行すると、有効性フィールドが不要になります。
- 「cplist --full」を実行すると、ロールバック目的で使用できないチェックポイントを含む、システム上のすべてのチェックポイントが表示されます。
HFScheck検証タイプ - 「rol」
- このフィールドには、チェックポイントで実行されたHFScheck検証のタイプが表示されます。
- 可能なタイプは「hfs」、「rdc」、「par」、「rol」です。
- hfsまたはfull:チェックポイント内のすべてのストライプで検証が実行されたことを意味します。
- roll :検証によってチェックポイント内のすべての新規ストライプまたは変更済みストライプがチェックされたことを意味します。
- 調査によると、データの整合性の問題が発生した場合、通常、影響を受けるストライプは、新しく作成または最近変更されたストライプです。このため、Avamarエンジニアリングでは、ローリング検証は、より時間の長い完全なHFScheck検証と同じくらい信頼性が高いと見なされることをお勧めします。
- Avamarシステムのデータ取得レートによっては、ローリングHFScheckによってチェックポイントの変更されていないストライプの割合もチェックされる場合があります。つまり、最終的には、変更されていないストライプであっても、すべてのストライプが整合性チェックされる可能性があります。
- rdc - 検証は完了したが、1つのノードが検証に参加していないことを意味します。 検証タイプが指定されていません。
- rdcとしてタグ付けされたチェックポイントでは、データの整合性を保証できません。このようなチェックにより、検証がまったく行えないよりも、データの整合性に対する信頼度が向上します。
削除可能な「---」
- このフィールドは、Avamarサーバーで強制されるチェックポイント保存設定に従って、チェックポイントを削除できるかどうかを示します。
- チェックポイントの保存は、「cphfschecked」および「cpmostrecent」パラメーターによって制御されます。
- サポート エンジニアの指示がない限り、チェックポイントの保存はデフォルトのままにする必要があります。
- チェックポイント保存設定が正しくないと、Avamarシステムがデータ消失のリスクにさらされたり、オペレーティング システムの容量の問題が発生したりする可能性があります。
REFCOUNT/NODECOUNT - 「ノード3/3」
- 最初の番号は参照カウントです。これにより、cplistコマンドに応答したノードの数がレポートされます。この値は、必ずしもオンラインのノード数を意味するわけではありません。
- 2番目の数字は nodecount です。これは、チェックポイントが最初に取得されたときに参加したノードの数を指します。つまり、その特定のチェックポイント ディレクトリーを含むデータ ノードの数です。
- これら2つのフィールドの出力の意味を考慮する前に、システムの状態(ノードの合計数とオンラインのノード数)とcplistの実行方法を注意深くメモします。
ストライプカウントフィールド - 「3530」
- このフィールドには、チェックポイントでキャプチャされたストライプの合計数が表示されます。
- ローリング チェックポイント検証では、この数のストライプのサブセットが検証されます。
- 完全なチェックポイント検証によって、すべてのチェックポイントが検証されます。
cplist出力
の例
例1:
cp.20130914190119 Sat Sep 14 20:01:19 2013 valid rol --- nodes 1/1 stripes 1401
cp.20130914192153 Sat Sep 14 20:21:53 2013 valid --- --- nodes 1/1 stripes 1401
これは何を意味するでしょうか。
- これはシングル ノード システムです。
- 2つの「健全な」チェックポイントまたは使用可能なチェックポイントがあります。
- cp.20130914190119はローリングHFScheckで検証されましたが、もう1つのチェックポイントは検証されていません。
- 両方のチェックポイントが1401ストライプをキャプチャしました。
例 2:
cp.20130911150620 Wed Sep 11 11:06:20 2013 valid rol --- nodes 9/9 stripes 121107
cp.20130911160421 Wed Sep 11 12:04:21 2013 valid --- --- nodes 9/9 stripes 121107
cp.20130912151051 Thu Sep 12 11:10:51 2013 valid --- --- nodes 8/9 stripes 121107
これは何を意味するでしょうか。
- 各チェックポイントでは、9つのノードがチェックポイント作成プロセスに参加しました。システムには9つのノードがあると仮定しますが、この情報についてはcplist出力に依存しません。
- 3つのチェックポイントのうち最も古いものは、ローリングHFScheckで検証されています。
- 最新のチェックポイント(9月12日)は、現在、そのチェックポイントを形成する9つのノードのいずれかでアクセスできません。
例3:
cp.20130915110057 Sun Sep 15 12:00:57 2013 valid rol --- nodes 3/3 stripes 3530
cp.20130915110654 Sun Sep 15 12:06:54 2013 valid --- del nodes 3/3 stripes 3530
cp.20130916053830 Mon Sep 16 06:38:30 2013 valid --- --- nodes 3/3 stripes 3530
cp.20130916060236 Mon Sep 16 07:02:36 2013 valid --- --- nodes 2/2 stripes 3530
これは何を意味するでしょうか。
- cp.20130915110654は、チェックポイント保存ルールに従って削除できます。
- cp.20130916060236は、3つのノードのいずれかがオフラインのときに取得されました。
例4:
AvamarシステムがData Domainと統合されている場合、Data Domainシステムが使用不可になった場合、cplistはチェックポイントが無効であることを示すことができます。例
cp.20130830173413 Fri Aug 30 10:34:13 2013 valid hfs --- nodes 1/1 stripes 82
cp.20130831000113 Fri Aug 30 17:01:13 2013 valid hfs --- nodes 1/1 stripes 82
Data Domainデバイスの電源がオフになっている場合は、次の手順を実行します。
admin@utility:~/>: cplist
cplist: ERROR: ddrmaint: <4750>Datadomain get checkpoint list operation failed.
2013/09/17-14:28:06.79970 [cplist] ERROR: <0001> ddrmaint: <4750>Datadomain get checkpoint list operation failed.
cp.20130830173413 Fri Aug 30 10:34:13 2013 invalid --- --- nodes 1/1 stripes 82
cp.20130831000113 Fri Aug 30 17:01:13 2013 invalid --- --- nodes 1/1 stripes 82