Avamar 檢查點是Avamar資料節點上的一組唯讀目錄。
這就像是Avamar系統的時間點快照。如果 Avamar 系統遇到無法更正的嚴重問題,其回復可能非常實用。
cplist 工具會建立 Avamar 系統上存在的檢查點清單。
此工具可由有權存取 Avamar 工具節點的任何人執行。
在決定如何在發生問題或正在進行維護的系統上繼續作業之前,請先瞭解哪些檢查點及其狀況至關重要。
不正確的檢查點狀態假設可能會導致數據遺失或無法復原的Avamar系統。
本文可協助讀者解譯工具的輸出。
以下是來自命令 cplist 的範例輸出。
cp.20130915110057 Sun Sep 15 12:00:57 2013 valid rol --- nodes 3/3 stripes 3530
cp.20130915110654 Sun Sep 15 12:06:54 2013 valid --- --- nodes 3/3 stripes 3530
我們查看上述第一個檢查點,並討論每個數據欄位的意義。
檢查點標籤名稱 - cp.20130915110057
- 這是檢查點的識別標籤,對應於檢查點啟動的時間。Cp。YYYYMMDDHHMMSS
- 從 Avamar v7.1,檢查點會以序號指派,而不是以檢查點開始日期和時間標記。
所花的時間 - 9 月 15 日 (周日) 12:00:57
- 建立檢查點的日期、日期和時間。這一律對應於檢查點標籤。
有效性 - 有效
- 如果此欄位顯示「有效」,檢查點會「完整」。
- 有效性代表檢查點是否適用於回復。
- 如果此欄位顯示「有效」,則不表示檢查點有通過 HFScheck 驗證。
- 執行「cplist」時,有效性欄位是多餘的,因為此命令預設會顯示可用檢查點。
- 執行「cplist --full」將會顯示系統上的所有檢查點,包括任何無法用於回復用途的檢查點。
HFScheck 驗證類型 - 「rol」
- 此欄位會顯示在檢查點執行的 HFSchck 驗證類型。
- 可能的類型為「hfs」、「rdc」、「par」、「rol」
- hfs 或 full - 表示檢查點中的所有等量都會執行驗證。
- roll - 表示驗證已檢查點中所有新或修改過的等量。
- 研究顯示,發生數據完整性問題時,通常受影響的等量是新建立或最近修改過的等量。因此,Avamar 工程部門建議您將滾動驗證視為實際可靠的完整 HFScheck 驗證。
- 根據 Avamar 系統的數據消化速率而定,滾動式 HF 色板也可能檢查點未修改等量的一部分。這表示最終可能會檢查所有等量,甚至是那些尚未修改的等量。
- rdc - 表示驗證已完成,但其中一個節點未參與驗證。 未指定驗證類型。
- 標記為 rdc 的檢查點無法保證數據的完整性。這樣的檢查可提供比完全沒有驗證更安心的數據完整性。
可刪除的「---」
- 此欄位會根據 Avamar 伺服器上強制執行的檢查點保留設定,指出是否可以刪除檢查點。
- 檢查點保留是由「cphfschcked」和「cpmostrecent」參數控制。
- 除非支援工程師建議,否則檢查點保留應保留為預設值。
- 不正確的檢查點保留設定可能會使 Avamar 系統面臨資料遺失的風險,或可能導致作業系統容量問題。
REFCOUNT/NODECOUNT - 「node 3/3」
- 第一個數位是重新計數。這會報告回應 cplist 命令的節點數目。此值不一定代表連線的節點數目。
- 第二個數位是節點計數。這指的是最初執行檢查點時的節點數量。換言之,有多少數據節點包含該特定檢查點目錄。
- 請小心記下系統的狀態 (在線節點總數和節點數目),以及 cplist 的執行方式,然後再考慮這兩個字段輸出的意義。
等量計數位段 - 「3530」
- 此欄位會顯示在檢查點中擷取的等量總數。
- 滾動檢查點驗證會驗證此等量的子集。
- 完整的檢查點驗證會驗證全部。
cplist 輸出
範例 1:
cp.20130914190119 Sat Sep 14 20:01:19 2013 valid rol --- nodes 1/1 stripes 1401
cp.20130914192153 Sat Sep 14 20:21:53 2013 valid --- --- nodes 1/1 stripes 1401
這代表什麼?
- 這是單一節點系統。
- 有兩個「健康」或可用的檢查點。
- cp.20130914190119 已使用滾動式 HFScheck 進行驗證,其他檢查點尚未驗證。
- 兩個檢查點均擷取 1401 個等量。
範例 2:
cp.20130911150620 Wed Sep 11 11:06:20 2013 valid rol --- nodes 9/9 stripes 121107
cp.20130911160421 Wed Sep 11 12:04:21 2013 valid --- --- nodes 9/9 stripes 121107
cp.20130912151051 Thu Sep 12 11:10:51 2013 valid --- --- nodes 8/9 stripes 121107
這代表什麼?
- 在每個檢查點期間,有九個節點會參與檢查點建立程式。我們可能會假設系統上有九個節點,但並非純依賴 cplist 輸出來取得此資訊。
- 在三個檢查點中,最舊的檢查點已使用滾動式 HFSchck 進行驗證。
- 最近的檢查點 (9 月 12 日) 目前無法在構成該檢查點的九個節點之一存取。
範例 3:
cp.20130915110057 Sun Sep 15 12:00:57 2013 valid rol --- nodes 3/3 stripes 3530
cp.20130915110654 Sun Sep 15 12:06:54 2013 valid --- del nodes 3/3 stripes 3530
cp.20130916053830 Mon Sep 16 06:38:30 2013 valid --- --- nodes 3/3 stripes 3530
cp.20130916060236 Mon Sep 16 07:02:36 2013 valid --- --- nodes 2/2 stripes 3530
這代表什麼?
- cp.20130915110654 符合根據檢查點保留規則刪除的資格。
- cp.20130916060236 是在三個節點的其中一個處於離線狀態時執行。
範例 4:
如果 Avamar 系統已與 Data Domain 整合,如果 Data Domain 系統無法使用,cplist 可能會顯示檢查點無效。例如:
cp.20130830173413 Fri Aug 30 10:34:13 2013 valid hfs --- nodes 1/1 stripes 82
cp.20130831000113 Fri Aug 30 17:01:13 2013 valid hfs --- nodes 1/1 stripes 82
如果 Data Domain 裝置已關閉電源;
admin@utility:~/>: cplist
cplist: ERROR: ddrmaint: <4750>Datadomain get checkpoint list operation failed.
2013/09/17-14:28:06.79970 [cplist] ERROR: <0001> ddrmaint: <4750>Datadomain get checkpoint list operation failed.
cp.20130830173413 Fri Aug 30 10:34:13 2013 invalid --- --- nodes 1/1 stripes 82
cp.20130831000113 Fri Aug 30 17:01:13 2013 invalid --- --- nodes 1/1 stripes 82