擴展 Data Domain 檔案系統容量後,Data Domain Operating System 不支援在儲存裝置之間主動重新平衡資料
Summary: 本文說明在 Data Domain Operating System (DDOS) 內沒有組建支援可在 Data Domain Restorer (DDR) 上擴展 Data Domain 檔案系統 (DDFS) 後,在儲存裝置之間重新平衡資料
This article applies to
This article does not apply to
This article is not tied to any specific product.
Not all product versions are identified in this article.
Instructions
與許多儲存陣列一樣,大多數型號的 Data Domain Restorer (DDR) 的容量都可以透過將外部儲存機櫃儲存櫃 (ES30、DS60) 新增至系統,然後將 Data Domain 檔案系統 (DDFS) 擴展至這些機櫃儲存櫃來增加。執行此操作時:
資料的重新平衡由兩個作業執行:
垃圾收集清理
垃圾回收清理 (GC) 是定期在 DDR 上執行的排定活動 (依預設,每週針對作用層執行一次,假設已啟用空間回收,則會視需要針對歸檔裝置執行)。當此作業執行時,會:
舉個簡單的例子:
將檔案寫入 DDR 時,會發生下列高階作業:
若要在 DDR 上獲得良好的資料讀取效能,檔案必須具有良好的「位置」(其資料在磁碟上是相對循序的),以便 DDFS 預先讀取演算法可以發揮最佳效能。另請注意,DDFS 會假設最有可能讀取 (用於修復或複寫) 的檔案是特定備份的最新複本。因此,針對特定類型的資料 (例如虛擬合成資料),將執行名為「位置修復」的程序來「最佳化」新寫入檔案資料的位置。執行時,位置修復會:
因此,透過正常使用位置修復與清理 (GC) 功能,DDR 可隨時間推移,在儲存櫃之間透明地重新平衡資料。這不需要系統管理員額外輸入,且表示不需要像有時在其他儲存陣列上看到的那樣,使用專用資料重新平衡操作功能。因此,為了提高重新平衡的速度,必須:
- 新機櫃儲存櫃已實際連接 (已接線且已開啟電源)
- Data Domain Operating System (DDOS) 會重新掃描儲存裝置,以識別是否存在新的機櫃儲存櫃
- 這些新機櫃儲存櫃隨後會新增至 DDR 內的儲存層 (作用層或特定歸檔裝置)
- 然後,可以在線上擴展此層,而無需中斷 DDFS
- 寫入該儲存層的任何新資料都會寫入現有和新的儲存櫃
- 但是,現有儲存櫃上的資料不會在新機櫃儲存櫃之間重新平衡
- 在 DDOS 中,資料儲存裝置為 4.5 Mb 的「容器」
- 4.5 Mb 容器在建立時,會以循環制方式寫入對應層歸檔裝置的所有機櫃儲存櫃中
- 當其他機櫃儲存櫃新增至層歸檔裝置時,除了現有機櫃之外,DDFS 還會開始將新 4.5 Mb 容器寫入這些機櫃 (循環制容器寫入時會包含新的機櫃)
- 但是,DDOS 不會進行任何特定嘗試 (或提供任何特定功能),來將層中的現有容器從現有容器遷移至新儲存櫃機櫃
- DDR 一開始在其作用層中有一個機櫃,且已滿至 90%
- 作用層中已新增額外機櫃,且 DDFS 已擴展至此機櫃
- 現在,會在現有機櫃和新機櫃之間以循環制方式寫入新建立的 4.5 Mb 容器
- 這會使現有機櫃缺少可用空間,而新增機櫃幾乎空白
資料的重新平衡由兩個作業執行:
- 垃圾收集清理
- 位置修復
垃圾收集清理
垃圾回收清理 (GC) 是定期在 DDR 上執行的排定活動 (依預設,每週針對作用層執行一次,假設已啟用空間回收,則會視需要針對歸檔裝置執行)。當此作業執行時,會:
- 識別層歸檔裝置中的哪些實體資料是「即時」資料 (由檔案系統中的一或多個檔案或物件 (例如快照) 使用) 或「失效」資料 (未由任何物件參考,因此,對系統來說是多餘的)
- 確定層歸檔裝置中儲存大部分「失效」資料的 4.5 Mb 容器
- 讀取這些 4.5 Mb 容器,並擷取其中包含的任何「即時」資料,接著「複製轉送」到新建立的 4.5 Mb 容器,這些容器會寫入層歸檔裝置中的所有儲存櫃
- 刪除舊的 4.5 Mb 容器,進而移除其中包含的失效資料,並釋放磁碟上的基礎空間以供重複使用
舉個簡單的例子:
- DDR 的作用層包含兩個儲存櫃 - 第一個儲存櫃包含 10000 個 4.5Mb 容器,而第二個儲存櫃包含 100 個 4.5Mb 容器 (第二個儲存櫃上的每個容器,在第一個儲存櫃上都有 100 個容器)
- GC 會執行並複製轉送第一個儲存櫃上 5000 個容器中的資料
- 這 5000 個容器中的即時資料會導致建立 1000 個新的 4.5 Mb 容器
- 這 1000 個新的 4.5 Mb 容器會寫入兩個儲存櫃
- 因此,GC 完成後,第一個儲存櫃可容納 5500 個 4.5Mb 容器,而第二個儲存櫃可容納 600 個容器 (第二個儲存櫃上的每個容器,在第一個儲存櫃上都有大約 9 個容器)
- 在 GC 的單次作業中,第一個與第二個儲存櫃之間的容器不平衡降低了 10 倍 - 預計在隨後的 GC 執行中將進一步降低,這表示資料會隨著時間推移在儲存櫃之間自然地重新平衡
將檔案寫入 DDR 時,會發生下列高階作業:
- 檔案會分割成大小為 4-12 Kb 的邏輯區塊 (稱為區段)
- 檢查每個區段,以查看該區段是否已存在於要寫入至檔案之層中的磁碟上
- 如果區段已存在,則其為重複資料,並且新寫入檔案中的區段將取代為指向磁碟上現有資料的指標
- 如果區段不存在,則其為唯一資料,因此會封裝到新的 4.5 Mb 容器中並寫入磁碟
若要在 DDR 上獲得良好的資料讀取效能,檔案必須具有良好的「位置」(其資料在磁碟上是相對循序的),以便 DDFS 預先讀取演算法可以發揮最佳效能。另請注意,DDFS 會假設最有可能讀取 (用於修復或複寫) 的檔案是特定備份的最新複本。因此,針對特定類型的資料 (例如虛擬合成資料),將執行名為「位置修復」的程序來「最佳化」新寫入檔案資料的位置。執行時,位置修復會:
- 檢查檔案參考的資料,以尋找資料在磁碟上未依序排列的部分 (顯示位置不佳)
- 從磁碟讀取此非循序資料,然後再次依序將資料 (作為重複資料) 寫入至新建立的 4.5 Mb 容器
- 在資料不平衡的系統上,預期大多數舊的非循序資料都存在於舊的已填滿的機櫃儲存櫃上
- 當此資料依序重新寫入為重複資料時,會將其放在新的 4.5 Mb 容器中,這些容器會在對應層的所有機櫃中實行循環制
- 因此,由位置修復建立的大多數「失效」資料 (舊的重複資料) 都存在於舊的已填滿的儲存櫃上
- 當 GC 執行時,大多數「失效」資料都會在舊的已填滿的儲存櫃上找到,並如上所述移除 (釋放這些儲存櫃上的空間)
因此,透過正常使用位置修復與清理 (GC) 功能,DDR 可隨時間推移,在儲存櫃之間透明地重新平衡資料。這不需要系統管理員額外輸入,且表示不需要像有時在其他儲存陣列上看到的那樣,使用專用資料重新平衡操作功能。因此,為了提高重新平衡的速度,必須:
- 提高 DDR 上資料「流失」的速率
- 增加 DDR 上本機修復的資料量
Affected Products
Data DomainArticle Properties
Article Number: 000019150
Article Type: How To
Last Modified: 29 Jul 2025
Version: 4
Find answers to your questions from other Dell users
Support Services
Check if your device is covered by Support Services.