PowerProtect Data Domain:DDHA 升级预检查
요약: 本知识库文章概述了准备 Data Domain 高可用性 (DDHA) 系统升级的综合准则。遵循这些说明可保证升级体验成功。
지침
高可用性 (HA) 功能允许您将两个保护系统配置为活动-备用对,从而在发生系统故障时提供冗余。高可用性使活动和备用系统保持同步。这样一来,如果活动节点因硬件或软件问题而发生故障,备用节点可以接替该故障节点。
以下系统支持 HA:
- Data Domain DD6800
- PowerProtect DD6900
- Data Domain DD9300
- PowerProtect DD9400
- PowerProtect DD9410
- Data Domain DD9800
- PowerProtect DD9900
- PowerProtect DD9910
准备 DDHA 系统以进行升级
在开始升级之前,请确保两个节点都以最佳方式运行。在任一节点受损时升级都可能导致故障和服务中断。在继续升级之前,请运行以下检查:
系统信息
验证系统主机名、序列号、型号、当前 DDOS 版本和正常运行时间。
| 活动节点 | 备用节点 |
|
# hostname # system show serialno # system show model # system show version # 正常运行时间 |
# hostname # system show serialno # system show model # system show version # 正常运行时间 |
iDRAC 配置
确认是否已配置 iDRAC,因为它是在重新启动期间监视和故障排除问题的宝贵工具。
| 活动节点 | 备用节点 |
| # ipmi show config | # ipmi show config |
并不是说 iDRAC 在戴尔传统系统 DD6800、DD9300 和 DD9800 上不可用。
文件系统状态
确保文件系统已启用并正在运行。
| 活动节点 | 备用节点 |
| # filesys status | 此命令在此节点上不可用。 |
警报和硬件故障
查看任何当前的系统警报并解决任何硬件故障。
| 活动节点 | 备用节点 |
| # alerts show current | # alerts show current |
警报并不总是在活动节点和备用节点之间共享。请务必分别检查两个节点是否有任何可能指示底层问题的活动警报。大多数警报仅在一个节点上可见,因此双节点验证至关重要。
HA 系统状态
在启动升级之前,请确保系统处于高可用性状态。
| 活动节点 | 备用节点 |
| # ha status detailed | 请参阅活动节点输出 |
系统容量
评估整体系统容量。
| 活动节点 | 备用节点 |
| # df -h | 此命令在此节点上不可用。 |
为确保 DDOS 升级过程顺利进行,建议在升级到 7.x 之前的 DDOS 版本时,在 Data Domain 系统上至少保留 10% 的可用空间 ,并且升级到 DDOS 7.x 及更高版本时至少保留 5% 的可用空间 。此可用空间对于处理临时文件以及对索引或元数据的任何更改至关重要。这有助于最大限度降低升级期间升级失败或性能下降的风险。
固件版本
确认所有系统组件都运行最新的固件。
| 活动节点 | 备用节点 |
| # system firmware show all | 请参阅活动节点输出 |
如果目标代码版本低于 7.7.5.1、7.10.1.0 或 7.11.x,请检查磁盘固件版本并参阅知识库文章 000204252 以获取指导。
| 活动节点 | 备用节点 |
| # disk show hardware | 请参阅活动节点输出 |
网络配置
验证系统的网络配置,并确保所有接口均能使用适当的 IP 地址正常运行。
| 活动节点 | 备用节点 |
| # net show settings | # net show settings |
在 DDHA 系统上,网络接口配置为浮动或固定。每种类型都有特定的行为和验证要求:
- 浮动接口:对于配置为浮动的接口,验证活动节点和备用节点上的每个网络接口卡 (NIC) 端口、别名或虚拟以太网 (veth) 接口是否都处于启用和正在运行状态。浮动接口预计在活动节点上显示 IP 地址,而在备用节点上显示 N/A。
- 固定接口:对于标记为固定的接口,请确保配置的每个 NIC 端口、别名或网络都处于已启用和正在运行状态。与浮动接口不同,固定接口不需要在两个节点上具有相同的配置。
- 高可用性互连 (veth99):确认 HA 互连 (veth99) 存在,并且所有必需的端口均已启用且正在运行。
- veth99 所需的连接数及其插槽位置因 Data Domain 型号而异。
磁盘状态
评估磁盘状态并确保没有故障 (F)、正在重建 (R)、复制 (C) 或不存在 (A) 的磁盘。
| 活动节点 | 备用节点 |
| # disk show state | # disk show state |
在 DDHA 配置中,备用节点不处理或提供数据。因此,连接到备用节点的机柜磁盘不显示“正在使用的磁盘”状态。相反,所有磁盘都显示为“已知磁盘”状态,这表示系统识别了它们,但它们不处于活动状态。这是预期行为,因为活动节点会处理所有数据作。
机柜状态
确保所有机柜设备正常工作。
| 活动节点 | 备用节点 |
| # enclosure show all | # enclosure show all |
机柜拓扑
从两个节点验证机柜拓扑。
| 活动节点 | 备用节点 |
| # enclosure show topology | # enclosure show topology |
提醒:
- 输出应为镜像图像。
- 查找 enc.ctrl.port 旁边的星号 (*),并检视 Error Message字段以查找控制器或线缆故障等问题。
- ?, !, 或 !! 等符号指示错误。
- 确认所有盘架编号均正确且一致。
复制状态
确保复制未初始化。如果是,请参阅知识库文章 000014079。
| 活动节点 | 备用节点 |
| # replication status | 此命令在此节点上不可用。 |
从 DDOS 版本 7.7.1 开始,不再支持目录复制。如果从低于 7.7.1 的版本升级并且配置了目录复制,请在升级之前参阅 DDOS 管理指南中的“目录到 MTree 复制迁移”部分。
硬件运行状况评估
在 Data Domain 系统上启动全面的硬件运行状况检查。
| 活动节点 | 备用节点 |
| # support healthcheck hardware | # support healthcheck hardware |
此命令并非与所有 DD 平台都兼容。有关更多信息,请参阅知识库文章 000326481。
文件系统清理
验证文件系统清理是否正在运行。如果处于活动状态,请允许它完成,或通过在活动节点上运行命令 # filesys clean stop手动停止它。
| 活动节点 | 备用节点 |
| # filesys clean status | 此命令在此节点上不可用。 |
云清理
验证云清理是否正在运行。如果处于活动状态,请允许它完成,或通过在活动节点上运行命令 # cloud clean stop手动停止它。
| 活动节点 | 备用节点 |
| # cloud clean status | 此命令在此节点上不可用。 |
数据移动
对于具有云层的系统,验证数据移动是否正在运行。如果处于活动状态,请通过在活动节点上运行命令 # data-movement stop all手动停止它。
| 活动节点 | 备用节点 |
| # data-movement status | 此命令在此节点上不可用。 |
备份和还原
如果有任何备份或还原活动正在进行中,请暂停或停止活动,然后再继续。
| 活动节点 | 备用节点 |
| # system show stats | # system show stats |
高可用性故障切换测试
故障切换测试的目的是通过启动从活动节点到备用节点的故障切换来验证高可用性。转换完成后,执行第二次故障切换以将控制权交还给原始节点,从而确保完整的双向故障切换功能。
活动节点:
- 运行
ha status用于确认系统处于高可用性状态且两个节点都处于联机状态的命令。 - 在该节点上运行
ha failover precheck(在 DDOS 版本 7.8 及更高版本中可用),以确认故障切换就绪性。 - 在该节点上运行
ha failover在活动节点上从活动节点切换到备用节点。
新的活动节点(以前的备用节点):
- 运行
ha status用于确认系统处于高可用性状态且两个节点都处于联机状态的命令。 - 在该节点上运行
ha failover precheck(在 DDOS 版本 7.8 及更高版本中可用),以确保系统已准备好进行故障切换。 - 在该节点上运行
ha failover在新的活动节点上切换回备用状态。
升级 RPM 软件包
将升级 RPM 软件包上传到活动节点。运行系统升级预检查命令后,软件包会自动复制到备用节点。
Data Domain 重复数据消除存储系统页面上提供了升级 RPM 程序包。
- 使用以下命令将 RPM 文件从客户端服务器传输到活动节点:
client-server# scp <rpm file> sysadmin@<active-node-hostname-or-IP-address>:/ddr/var/releases/
-
- 系统会提示输入客户定义的密码。活动节点上的目标目录是 /ddr/var/releases。
- 文件传输完成后,通过运行以下命令验证有关活动节点的系统软件包信息:
active-node# system package list
系统升级预检查
从活动节点中,运行 system upgrade precheck <file> 命令确认该锁定已释放。如果预检查成功完成且没有任何错误,则系统已准备好继续 DDOS 升级。有关升级 DDHA 系统的详细指导,请参阅知识库文章 000009653。