Avamar-Data Domain:目標的高 DD 使用率:分析與最佳實務
Summary: 來源和目標 Data Domain 在磁片使用率方面並不預期會完全相等。本文件說明目標 Data Domain 可能顯示比來源 Data Domain 更高的使用率的可能原因。 請務必注意,使用率的差異可能是以下原因的組合所致。
Symptoms
目標 Data Domain 顯示比來源 Data Domain 較高的使用率。
Cause
從 Avamar 的角度來看:
復原
如果來源 Data Domain 上有復原,目的地 Data Domain 可根據復原時間而保留額外數天的資料。在目的地的額外備份到期之前,此差異將存在。
範例:DD1 會複製到 DD2。由於復原時間為 2 天,因此我們發現來源有 3 個備份,但 5 個備份已複製到目的地。
部分複製
如果複製未成功完成,已複製的資料會儲存至少 7 天,並透過 Data Domain 清理進行清理。 部分複製包含資料和指紋,可讓後續重新嘗試複製資料的速度更快。
如果複製在完成之前就失敗,部分複製額外負荷可能與複製的資料量一樣高。
保留的差異
在 Avamar 伺服器組態中,可以設定將複本保留在目的地伺服器上的時間超過來源。這會導致容量使用率的差異。
Avamar 組態差異
Avamar 伺服器上的檢查點備份可能非常龐大。如果僅在目的地 Avamar 上設定,則會增加目的地上 Data Domain 的使用率。
從 Data Domain 的角度來看:
手印。
在複寫期間將資料傳送至 Data Domain 時,會進行重複資料刪除。資料的指紋會先傳送到目的地 Data Domain,以檢查目的地是否有資料。
-
如果 Data Domain 傳回該處有指紋,則不需要重新傳送資料
-
如果 Data Domain 未傳回找不到指紋,則表示下列兩者之一:
-
該處沒有指紋
-
目的地 Data Domain 有指紋,但希望資料無論如何都會傳送,以改善 Data Domain 的特殊位置。
-
Data Domain 處於忙碌狀態,不想完成整個搜尋。
-
如果重複的資料傳送到 Data Domain,則在清理過程中,移除資料的額外副本,即可刪除重複的資料。
目的地 Data Domain 將有較高的使用率,但變化不應很大。
中繼資料額外負荷。
每個備份的檔案都隨附其檔案資訊中繼資料,並包含每個檔案的指紋。
範例:若為 1TB 檔案,使用成本是檔案大小的 0.3%。
在平均 8kB 的資料區塊中,有 82B 的中繼資料。 這大約是運算後容量的 0.01% 額外負荷。
由於 Avamar 結合備份,每次完成備份時,都會從增量取得綜合完整備份,因此 Avamar 整合會另外增加額外負荷。
我們也觀察到,當備份略過或資料已無序複製時,中繼資料額外負荷會增加。
唯一沒有產生此額外負荷的備份是 VM 備份。將中繼資料成本降至最低。
範例:當備份無序複製時,它會在比 Inc. 大得多的中繼資料額外負荷的目標上建立 L0 備份。假設我們有 5 天備份。
複製最舊到最新:
第一個複製將是 L0,之後所有後續都會是 Inc.
1xL0 + 4xInc
複製最新到最舊:
複製會略過備份:
檔案追蹤
Data Domain 必須知道如何從已刪除重複資料的區塊建立每個檔案。萬一 Data Domain 沒有此資訊,必須重新建置此資訊,並重新建立指紋鏈結。這可能會導致容量大幅增加。
有兩種情況可能會導致目的地 Data Domain 的容量大幅增加:
1.檔案追蹤遺失:
範例:如果目的地 Data Domain 是在具有多個 IP 的 DNS 中設定,且 IP 以循環制分配,來源 Data Domain 會每次連線到不同的 IP。將無法識別昨天傳送的資料複本,而且會傳送更多資料,如此會增加中繼資料成本。
當 Avamar 伺服器復原完成後, 當SFS_BFT_ENABLED 顯示為 false 時,可能會發生此問題。
這可能會導致非常大的差異。 備份到期後會回收空間。
線上的重複資料刪除
Data Domain 會要求資料邏輯大小的最多 6% 的重複資料,以優化其線上的重複資料刪除。
重複資料刪除和壓縮的差異。
Data Domains 會獨立在本機儲存裝置上進行自己的重複資料刪除和資料壓縮作業,並根據目的地資料的儲存方式而定,這不會同樣造成使用率的差異。
Data Domain 清理
如果來源和目的地 Data Domains 在不同天執行清理,或如果其中一個資料網域執行時更頻繁或時間更長,則所使用的容量會有差異。
Resolution
最佳實務:
由於兩個 Data Domain 系統、來源和目的地之間的使用率會有所差異,因此有一些最佳實務可協助將差異降至最低:
-
盡快處理發生的 hfschck 故障和硬體故障,即可將復原的可能性降至最低。
-
請確定複製作業已順利完成。如果複製完成時發生持續問題,請聯絡 Dell Technologies 支援以檢閱組態。
-
如果您需要將兩個資料網域維持類似的使用率,請在備份的來源和目標複本上維持相同的保留,並確保兩個 Avamar 伺服器上的檢查點備份的設定相同。
-
確保複製一律為最舊至最新,而且不會略過備份。
-
如果 Data Domain 配置了多個 IP,請確定 IP 並未以循環制分佈。
-
讓兩個 Data Domain 系統、來源和目的地,在同一天和同一時間執行清理。
-
已SFS_BFT_ENABLED設為 true。 這必須由技術支援啟用 (提出 SR 並參考此 KB# - 182755)