Avamar-Data Domain:目標的高 DD 使用率:分析與最佳實務

Summary: 來源和目標 Data Domain 在磁片使用率方面並不預期會完全相等。本文件說明目標 Data Domain 可能顯示比來源 Data Domain 更高的使用率的可能原因。 請務必注意,使用率的差異可能是以下原因的組合所致。

This article applies to This article does not apply to This article is not tied to any specific product. Not all product versions are identified in this article.

Symptoms

目標 Data Domain 顯示比來源 Data Domain 較高的使用率。

Cause

從 Avamar 的角度來看:

復原
如果來源 Data Domain 上有復原,目的地 Data Domain 可根據復原時間而保留額外數天的資料。在目的地的額外備份到期之前,此差異將存在。

範例:DD1 會複製到 DD2。由於復原時間為 2 天,因此我們發現來源有 3 個備份,但 5 個備份已複製到目的地。

部分複製
如果複製未成功完成,已複製的資料會儲存至少 7 天,並透過 Data Domain 清理進行清理。  部分複製包含資料和指紋,可讓後續重新嘗試複製資料的速度更快。
如果複製在完成之前就失敗,部分複製額外負荷可能與複製的資料量一樣高。

保留的差異
在 Avamar 伺服器組態中,可以設定將複本保留在目的地伺服器上的時間超過來源。這會導致容量使用率的差異。

Avamar 組態差異
Avamar 伺服器上的檢查點備份可能非常龐大。如果僅在目的地 Avamar 上設定,則會增加目的地上 Data Domain 的使用率。

從 Data Domain 的角度來看:

手印。

在複寫期間將資料傳送至 Data Domain 時,會進行重複資料刪除。資料的指紋會先傳送到目的地 Data Domain,以檢查目的地是否有資料。

  • 如果 Data Domain 傳回該處有指紋,則不需要重新傳送資料

  • 如果 Data Domain 未傳回找不到指紋,則表示下列兩者之一:

    • 該處沒有指紋

    • 目的地 Data Domain 有指紋,但希望資料無論如何都會傳送,以改善 Data Domain 的特殊位置。

    • Data Domain 處於忙碌狀態,不想完成整個搜尋。

如果重複的資料傳送到 Data Domain,則在清理過程中,移除資料的額外副本,即可刪除重複的資料。
目的地 Data Domain 將有較高的使用率,但變化不應很大。

中繼資料額外負荷
每個備份的檔案都隨附其檔案資訊中繼資料,並包含每個檔案的指紋。

範例:若為 1TB 檔案,使用成本是檔案大小的 0.3%。

在平均 8kB 的資料區塊中,有 82B 的中繼資料。  這大約是運算後容量的 0.01% 額外負荷。
由於 Avamar 結合備份,每次完成備份時,都會從增量取得綜合完整備份,因此 Avamar 整合會另外增加額外負荷。
我們也觀察到,當備份略過或資料已無序複製時,中繼資料額外負荷會增加。
唯一沒有產生此額外負荷的備份是 VM 備份。將中繼資料成本降至最低。

範例:當備份無序複製時,它會在比 Inc. 大得多的中繼資料額外負荷的目標上建立 L0 備份。假設我們有 5 天備份。

複製最舊到最新:

第一個複製將是 L0,之後所有後續都會是 Inc.
1xL0 + 4xInc

複製最新到最舊:

所有複製都將是 L0,因為 n-1 天無法在基本 Inc. 上使用。
5xL0

複製會略過備份:

假設第 3 天的備份熟練。  第 1 天是 L0,第 2 天是 Inc,則第 4 天將又是 L0。
L0+Inc+L0+Inc


檔案追蹤
Data Domain 必須知道如何從已刪除重複資料的區塊建立每個檔案。萬一 Data Domain 沒有此資訊,必須重新建置此資訊,並重新建立指紋鏈結。這可能會導致容量大幅增加。
有兩種情況可能會導致目的地 Data Domain 的容量大幅增加:


1.檔案追蹤遺失:

範例:如果目的地 Data Domain 是在具有多個 IP 的 DNS 中設定,且 IP 以循環制分配,來源 Data Domain 會每次連線到不同的 IP。將無法識別昨天傳送的資料複本,而且會傳送更多資料,如此會增加中繼資料成本。

2.未啟用檔案追蹤:
範例:SFS_BFT_ENABLED必須設為 true,以確保基礎檔案追蹤可在目的地系統上綜合備份。這可允許針對儲存裝置而最佳化傳入複製。如果 SFS_BFT_ENABLED 設為 false,則資料會儲存至 DD 上的最終備份位置,等於壓縮前傳入的資料。

當 Avamar 伺服器復原完成後, 當SFS_BFT_ENABLED 顯示為 false 時,可能會發生此問題。

這可能會導致非常大的差異。  備份到期後會回收空間。

線上的重複資料刪除
Data Domain 會要求資料邏輯大小的最多 6% 的重複資料,以優化其線上的重複資料刪除。

重複資料刪除和壓縮的差異。
Data Domains 會獨立在本機儲存裝置上進行自己的重複資料刪除和資料壓縮作業,並根據目的地資料的儲存方式而定,這不會同樣造成使用率的差異。

Data Domain 清理
如果來源和目的地 Data Domains 在不同天執行清理,或如果其中一個資料網域執行時更頻繁或時間更長,則所使用的容量會有差異。

Resolution

最佳實務:

由於兩個 Data Domain 系統、來源和目的地之間的使用率會有所差異,因此有一些最佳實務可協助將差異降至最低:

  1. 盡快處理發生的 hfschck 故障和硬體故障,即可將復原的可能性降至最低。

  2. 請確定複製作業已順利完成。如果複製完成時發生持續問題,請聯絡 Dell Technologies 支援以檢閱組態。

  3. 如果您需要將兩個資料網域維持類似的使用率,請在備份的來源和目標複本上維持相同的保留,並確保兩個 Avamar 伺服器上的檢查點備份的設定相同。

  4. 確保複製一律為最舊至最新,而且不會略過備份。

  5. 如果 Data Domain 配置了多個 IP,請確定 IP 並未以循環制分佈。

  6.  讓兩個 Data Domain 系統、來源和目的地,在同一天和同一時間執行清理。

  7. 已SFS_BFT_ENABLED設為 true。  這必須由技術支援啟用 (提出 SR 並參考此 KB# - 182755)

Affected Products

Avamar Server
Article Properties
Article Number: 000182755
Article Type: Solution
Last Modified: 20 Sept 2024
Version:  6
Find answers to your questions from other Dell users
Support Services
Check if your device is covered by Support Services.