PowerProtect Data Domain:DDHA 升級預先檢查
요약: 本知識文章概述了準備 Data Domain 高可用性 (DDHA) 系統升級的全面準則。遵循這些說明可確保升級體驗成功。
지침
高可用性 (HA) 功能允許您將兩個保護系統配置為活動-備用對,在發生系統故障時提供冗餘。HA 使活動和備用系統保持同步。這樣,如果主動節點由於硬體或軟體問題而發生故障,備用節點可以接管該故障節點。
下列系統支援 HA:
- Data Domain DD6800
- PowerProtect DD6900
- Data Domain DD9300
- PowerProtect DD9400
- PowerProtect DD9410
- Data Domain DD9800
- PowerProtect DD9900
- PowerProtect DD9910
準備 DDHA 系統進行升級
開始升級前,請確定兩個節點都以最佳狀態運作。在任一節點遭到入侵時進行升級,可能會導致故障和服務中斷。在繼續升級之前,請執行下列檢查:
系統資訊
確認系統主機名稱、序號、型號、目前 DDOS 版本和連續運作時間。
| 主動節點 | 備用節點 |
|
# 主機名稱 # 系統顯示序列 # 系統展示模型 # 系統顯示版本 # 正常執行時間 |
# 主機名稱 # 系統顯示序列 # 系統展示模型 # 系統顯示版本 # 正常執行時間 |
iDRAC 組態
確認是否已設定 iDRAC,因為它是在重新開機期間監控和排除問題的寶貴工具。
| 主動節點 | 備用節點 |
| # IPMI 顯示設定 | # IPMI 顯示設定 |
並不是說 iDRAC 不適用於 Dell 老式系統 DD6800、DD9300 和 DD9800。
檔案系統狀態
請確認檔案系統已啟用且正在執行中。
| 主動節點 | 備用節點 |
| # filesys status | 此命令在此節點上不可用。 |
警示和硬體故障
檢閱任何目前的系統警示,並解決任何硬體故障。
| 主動節點 | 備用節點 |
| # 警報顯示目前 | # 警報顯示目前 |
警示並非總是在使用中和備用節點之間共用。請務必分別檢查兩個節點,是否有任何可能指示基礎問題的活動警報。大多數警報僅在一個節點上可見,因此雙節點驗證至關重要。
HA 系統狀態
在開始升級之前,請確保系統處於高可用性狀態。
| 主動節點 | 備用節點 |
| # 詳細 HA 狀態 | 請參閱使用中節點輸出 |
系統容量
評估整體系統容量。
| 主動節點 | 備用節點 |
| # df -h | 此命令在此節點上不可用。 |
為確保 DDOS 升級程序順利進行,建議在升級至 7.x 之前的 DDOS 版本時,在 Data Domain 系統上維持至少 10% 的可用空間 ,並至少維持 5% 的可用空間 以用於升級至 DDOS 7.x 及更新版本。此可用空間對於處理臨時檔以及對索引或元數據的任何更改至關重要。這有助於將升級失敗或升級期間性能下降的風險降至最低。
韌體版本
確認所有系統元件執行的是最新韌體。
| 主動節點 | 備用節點 |
| # 系統韌體全部顯示 | 請參閱使用中節點輸出 |
如果目標程式碼比 7.7.5.1、7.10.1.0 或 7.11.x 舊,請檢查磁碟韌體版本,並參閱 KB 文章 000204252 取得指引。
| 主動節點 | 備用節點 |
| # 磁碟顯示硬體 | 請參閱使用中節點輸出 |
網路組態
驗證系統的網路組態,並確保所有介面均可使用適當的 IP 位址運作。
| 主動節點 | 備用節點 |
| # 網路顯示設定 | # 網路顯示設定 |
在 DDHA 系統上,網路介面設定為浮動或固定。每種類型都有特定的行為和驗證要求:
- 浮動介面:對於配置為浮動的介面,請驗證每個網路介面卡 (NIC) 埠、別名或虛擬乙太網 (veth) 介面在活動和備用節點上都處於啟用和運行狀態。預計浮動介面在主動節點上顯示IP位址,而在備用節點上顯示N/A。
- 固定介面:對於標示為固定的介面,請確定每個已設定的 NIC 連接埠、別名或 veth 均處於啟用且執行中狀態。與浮動介面不同,固定介面不需要在兩個節點之間具有相同的配置。
- HA 互連 (veth99):確認 HA 互連 (veth99) 已存在,且所有必需的連接埠均已啟用並正在執行中。
- veth99 所需的連線數及其插槽位置因 Data Domain 型號而異。
磁碟狀態
評估磁碟狀態,並確定沒有故障 (F)、正在重建 (R)、複製 (C) 或不存在 (A) 磁碟。
| 主動節點 | 備用節點 |
| # 磁碟顯示狀態 | # 磁碟顯示狀態 |
在 DDHA 組態中,待機節點不會處理或提供資料。因此,附加至備用節點的機櫃磁碟不會顯示「使用中磁碟」狀態。相反地,所有磁碟都會以「已知磁碟」狀態出現,表示系統可識別這些磁碟,但它們並非處於活動狀態。這是預期行為,因為主動節點處理所有數據操作。
機櫃狀態
確定所有機櫃裝置運作正常。
| 主動節點 | 備用節點 |
| # 機櫃全部顯示 | # 機櫃全部顯示 |
機櫃拓樸
從兩個節點驗證機櫃拓撲。
| 主動節點 | 備用節點 |
| # 機櫃顯示拓撲 | # 機櫃顯示拓撲 |
注意:
- 輸出應為鏡像圖像。
- 在 enc.ctrl.port 旁尋找星號 (*),並檢閱錯誤訊息欄位是否有控制器或纜線故障等問題。
- 符號,如?, !,或!!指示錯誤。
- 確認所有機架編號正確且一致。
複寫狀態
請確定複寫未初始化。如果是,請參閱知識文章 000014079。
| 主動節點 | 備用節點 |
| # 複製狀態 | 此命令在此節點上不可用。 |
從 DDOS 版本 7.7.1 開始,不再支援目錄複寫。如果從 7.7.1 之前的版本升級並已設定目錄複寫,請先參閱 DDOS 管理指南中的「目錄對 MTree 複寫遷移」一節,然後再進行升級。
硬體執行狀況評估
啟動 Data Domain 系統的全面硬體執行狀況檢查。
| 主動節點 | 備用節點 |
| # 支援健康檢查硬體 | # 支援健康檢查硬體 |
此命令與所有 DD 平台不相容。如需詳細資訊,請參閱 KB 文章 000326481。
檔案系統清理
檢查檔案系統清理是否正在執行中。如果處於作用中狀態,請允許其完成,或透過在作用中節點上執行命令 # filesys clean stop 手動將其停止。
| 主動節點 | 備用節點 |
| # filesys 清理狀態 | 此命令在此節點上不可用。 |
雲端清理
確認雲端清理是否正在執行中。如果處於作用中,請允許其完成,或透過在作用中節點上執行命令 # 雲端清理停止來手動停止它。
| 主動節點 | 備用節點 |
| # 雲端清理狀態 | 此命令在此節點上不可用。 |
資料移動
針對具有雲端階層的系統,請確認資料移動是否正在執行中。如果處於活動狀態,請在活動節點上執行命令 # data-movement stop all,手動將其停止。
| 主動節點 | 備用節點 |
| # data-movement status | 此命令在此節點上不可用。 |
備份及還原
如果有任何備份或還原活動正在進行中,請先暫停或停止再繼續。
| 主動節點 | 備用節點 |
| # 系統顯示統計 | # 系統顯示統計 |
HA 容錯移轉測試
故障轉移測試的目的是通過啟動從活動節點到備用節點的故障轉移來驗證高可用性。轉換完成後,請執行第二次容錯移轉,將控制權交還給原始節點,確保提供完整的雙向容錯移轉功能。
使用中節點:
- 執行
ha status命令,以確認系統處於高可用性狀態,且兩個節點都在線上。 - 執行
ha failover precheck(適用於 DDOS 版本 7.8 及更新版本),以確認容錯移轉的準備情況。 - 執行
ha failover在主動節點上從主動節點切換到備用節點。
新增使用中節點 (先前的待機節點):
- 執行
ha status命令,以確認系統處於高可用性狀態,且兩個節點都在線上。 - 執行
ha failover precheck(適用於 DDOS 版本 7.8 及更新版本),以確保系統已準備好進行容錯移轉。 - 執行
ha failover在新的活動節點上切換回待機狀態。
升級 RPM 套裝
將升級 RPM 套裝上傳至主動節點。執行系統升級預先檢查命令後,套裝會自動複製到待機節點。
升級 RPM 套裝可在 Data Domain 重複資料刪除儲存系統 頁面上取得。
- 使用下列命令,將 RPM 檔案從用戶端伺服器傳輸到主動節點:
client-server# scp <rpm file> sysadmin@<active-node-hostname-or-IP-address>:/ddr/var/releases/
-
- 系統會提示您輸入客戶已定義的密碼。作用中節點上的目標目錄為 /ddr/var/releases。
- 檔案傳輸完成後,執行以下命令,確認作用中節點的系統套件資訊:
active-node# system package list
系統升級預先檢查
從主動節點,執行 system upgrade precheck <file> 命令為貴組織設定主要和次要 IT 連絡人。如果預先檢查順利完成且未發生任何錯誤,便代表系統已準備好繼續進行 DDOS 升級。如需升級 DDHA 系統的詳細指南,請參閱知識文章 000009653。