PowerStore:如何准备 PowerStore 无中断升级
Summary: 以下文章旨在提供执行 PowerStore 无中断升级 (NDU) 时要遵循的最佳实践。
Instructions
如何使用本文。
在执行 PowerStore 无中断升级 (NDU) 之前,请仔细查看本文中的以下子部分,了解 NDU 规划注意事项和预防措施。如需进一步参考,请参阅软件升级指南。
|
子部分 |
描述 |
|---|---|
|
已知问题和限制 |
在无中断升级期间您可能会遇到的最新已知问题或限制,这可能会导致存储服务中断。 |
|
建议的 PowerStoreOS 版本 |
查看当前的 PowerStoreOS 版本建议,以确定无中断升级目标版本。 |
|
初步检查 |
在开始无中断升级之前运行系统检查和运行状况检查脚本的步骤。 |
|
主机就绪性最佳实践 — 已知 |
在无中断升级期间您可能会遇到的已知问题或限制,这可能会导致主机或应用程序端中断。 |
|
常规升级规划注意事项 |
与无中断升级相关的各种建议。 |
|
一般升级注意事项 |
与 NDU 过程相关的注意事项。 |
|
收尾检查 |
在完成无中断升级之后运行系统检查和运行状况检查脚本的步骤。 |
已知问题和限制
PowerStoreOS 特定问题
-
NVMe/TCP 端口数量(升级到 PowerStoreOS 3.2 或更高版本时)
-
当存储网络扩展到相当数量的 NVMe/TCP 端口(大于 50 个)并启用了“Auto Discovery of CDC”选项时,无中断升级过程可能会导致 PowerStore 群集中的资源不足。这种情况可能会导致所有 NVMe/TCP 端口上的 CDC 连接状态显示为“Uninitialized”。此外,后续升级请求可能会失败。
-
有关此问题的更多详细信息以及如何在升级到 PowerStoreOS 版本 3.2 之前避免此问题,请参阅文章 PowerStore:当存储网络扩展到 50(或更多)时,PowerStoreOS 升级可能会失败,并显示“Uninitialized”端口
-
- 如果仅从 3.6.1.0 升级,请暂停所有 Metro 会话。
- 有关更多信息,请参阅 KB-000223948 PowerStore:Metro 卷上的重叠 I/O 可能会导致意外重新启动或延迟增加
PowerStore T 型号
型号:500T、1000T、1200T、3000T、3200T、5000T、5200T、7000T、9000T、9200T
无限制
PowerStore Q 型号
型号:3200Q
无限制
PowerStore X 型号
型号:1000X、3000X、5000X、7000X、9000X
-
PowerStore X 不支持 PowerStoreOS 版本 3.5 或更高版本。
-
在启动任何 NDU 过程之前,请验证已在两个 ESXi 节点上启动 SSH,并且在启动时启用了 SSH。
请参阅文章 PowerStore:禁用 PowerStoreX-SSH 可能会导致节点故障,了解更多信息。 -
如果 VMware NSX-T 数据中心部署在 PowerStore X 型号群集上,在执行无中断升级之前,请查看文章 PowerStore:PowerStoreX:如果在 vSphere 升级期间将 NSX-T 托管的虚拟分布式交换机迁移到 vSphere 分布式交换机,则在重新配置 PowerStore 管理网络后,连接将丢失,以了解更多信息。
-
将 PowerStore X 阵列升级到 PowerStoreOS 版本 2.1.1.0 后,转至 vCenter Server 并检查 PowerStore X esxi_node 的许可。确保 VMware vSphere 7 许可证的状态正常。
-
vSphere 群集上的所有外部 ESXi 主机都应运行与内部主机相同的 ESXi 版本。
建议的 PowerStoreOS 版本
-
对于使用 NVMe 扩展柜 (ENS24) 的 PowerStore 设备,建议使用 PowerStoreOS 3.6.0.0(或更高版本)。
-
对于在其环境中使用 Veeam 作为备份解决方案的 PowerStore 设备,建议使用 PowerStoreOS 3.6.0.0(或更高版本)。
-
如果将 iSCSI 传输用作远程系统传输协议 (RSTP),则从 PowerStoreOS 版本 3.X 到 4.X 的 无中断升级会受到限制。在 NDU 升级到 4.X 之前 ,受影响的客户必须将其 RSTP 更改为 TCP 传输。
初步检查
关于此步骤
PowerStore 包括各种工具,可帮助诊断和主动识别应在无中断升级之前修复的各种问题。
-
升级前运行状况检查 (PUHC) 是随每个升级软件包提供的集成式实用程序,主要用于进行针对无中断升级就绪性的测试。
-
系统运行状况检查 (SHC) 是随从 PowerStoreOS 2.0 开始的升级软件包提供的集成式实用程序,它包括设备的其他运行状况测试。
-
升级扩展是系统运行状况检查 (SHC) 的增强功能,增加了特定于无中断升级的测试。它在 PowerStoreOS 2.1 中引入,仅可用于从此版本升级。
请参阅下表,根据您当前的 PowerStoreOS 版本确定 NDU 之前 要使用的工具:
|
正在运行的 PowerStoreOS 版本 |
在无中断升级之前要使用的工具 |
|---|---|
|
4.x |
|
|
3.x |
|
|
2.1.x |
|
|
2.0.x |
|
|
1.x |
|
有关初步检查工具的详细信息,请参阅以下三个子部分。
升级前运行状况检查
-
请参阅文章 PowerStore:如何在软件升级之前使用升级前运行状况检查和系统检查来检查群集的运行状况,了解有关在无中断升级之前使用升级前运行状况检查的说明。
-
查看在升级前运行状况检查期间报告错误或警告状态消息的任何项目,并相应地处理每个项目。
-
如果您需要协助解决显示的任何错误或警告消息,请联系 Dell Technologies 支持服务寻求帮助。
注意:绿色复选标记不表示升级前运行状况检查已完成并且没有任何错误或警告消息。绿色复选标记仅表示运行状况检查步骤已成功完成。有关更多信息,请参阅文章 PowerStore:出现警告时,运行状况检查显示全绿。
系统运行状况检查
提醒:请考虑在 NDU 之前至少一周运行系统检查,以便留出足够的时间进行纠正(如有必要)。
-
运行 PowerStoreOS 版本 2.0.x 的设备提供系统检查作为在无中断升级之前使用的工具。
-
请参阅 PowerStore:如何在软件升级之前使用升级前运行状况检查和系统检查来检查群集的运行状况,了解有关在无中断升级之前使用系统运行状况检查的说明。
-
查看在系统运行状况检查期间报告失败状态消息的任何项目,并相应地处理每个项目。
-
如果您需要协助解决显示的任何失败状态消息,请联系 Dell Technologies 支持服务寻求帮助。
升级扩展
-
升级扩展在运行 PowerStoreOS 版本 2.1.x 的设备上可用。
-
请参阅文章 PowerStore:如何在软件升级之前使用升级前运行状况检查和系统检查来检查群集的运行状况,了解有关在无中断升级之前使用升级扩展的说明。
-
查看在升级扩展期间报告失败状态消息的任何项目,并相应地处理每个项目。
-
如果您需要协助解决显示的任何失败状态消息,请联系 Dell Technologies 支持服务寻求帮助。
未解决的警报
-
登录到要升级的设备的 PowerStore Manager,单击 Monitoring 选项卡以查看任何未解决的警报。
-
确定是否有任何需要引起注意的未解决警报。查看严重性级别为严重、主要或次要的警报,如果可能,尝试纠正警报所报告的问题。
-
如有需要,请联系 Dell Technologies 支持服务寻求帮助,以在继续升级之前评估和处理任何未解决的警报。
主机就绪性最佳实践、已知问题和限制
特定于操作系统
-
vSphere ESXi
-
升级到 PowerStoreOS 版本 2.0(或更高版本)时,使用 NVMe/FC 和 NVMe/TCP 数据存储区运行 8.0 U1 的 ESXi 主机可能会在 PowerStore 节点重新启动/故障期间遇到 I/O 错误。有关此问题以及如何解决此问题的更多详细信息,请参阅文章 PowerStore:无中断升级期间在 NVMe 数据存储区上观察到 I/O 错误
-
-
Solaris
-
对于使用 低于 3.5 的 PowerStore 代码的客户,从 Solaris 11.4 SRU 35 开始,Solaris 本机 MPxIO 支持 NDU。请联系您的服务提供商,获取有关早期 Solaris 版本或 Solaris 更新的 PowerStore 无中断升级支持。
- 对于已使用 PowerStore 代码 3.5 及更高版本的客户,Solaris 本机 MPxIO 10/11.x 支持 NDU
常规
-
有关支持的多路径选项及其关联版本,请参阅 Dell Technologies PowerPath 简单支持矩阵。
-
有关主机连接的最佳实践,请参阅所连接主机作系统对应的《 E-Lab 主机连接指南
》文档。
-
确保访问 PowerStore 设备的所有主机均已正确配置冗余路径和正确配置的多路径软件。
-
-
有关支持的配置(HBA 固件和驱动程序、拓扑、已知限制和一般准则),请参阅 E-Lab Interoperability Navigator
:
-
对于 SCSI 环境:
-
请参阅 E-Lab 简单支持矩阵
。
-
-
对于 NVMe-oF 环境:
-
有关支持的配置,请参阅 E-Lab NVMe/FC 主机/存储互作性简单支持矩阵
。
-
有关支持的配置,请参阅 E-Lab NVMe/TCP 主机/存储互作性简单支持矩阵
。
-
-
-
运行 PowerStore 主机验证脚本 (HVS) 以扫描和确认主机配置。有关如何为已连接主机操作系统下载和安装 HVS 的说明,请转至:
-
VMware ESXi— 请参阅文章 PowerStore:ESXi 的主机验证脚本。
-
常规升级规划注意事项
-
一般准则
-
下载最新版本的 PowerStore 发行说明 ,以确定执行 PowerStore 升级所需的软件更新包。
-
-
虽然更改升级包文件名不会影响 PowerStore 设备的无中断升级,但可能会影响使用此升级包在设备上执行的后续过程,例如节点修复或内部 M.2 启动模块更换(主 M.2)。有关此问题以及如何避免此问题的更多详细信息,请参阅文章 PowerStore:如果从戴尔支持站点下载升级包后文件名发生更改,PowerStoreOS 重新安装(节点修复)会失败。
-
您可以一次在 PowerStore 群集上上传最多十 (10) 个升级软件包。但是,在升级开始后,必须在群集中的所有设备上成功完成升级,然后才能执行另一个升级。
-
从戴尔支持网站下载 PowerStoreOS 升级包时,请确保在下载到本地计算机后,其文件名保持不变,并且没有自动附加后缀。如果文件名更改,使用该升级包的无中断升级可能会失败。
-
在软件更新过程中,您可能会暂时断开与 PowerStore Manager 的连接,请在几分钟后(最多 5 分钟)重试登录 PowerStore Manager。
-
在升级期间某些管理操作可能会被阻止。
-
软件更新过程成功完成后,关闭用户界面的浏览器选项卡,然后从新的浏览器选项卡重新登录,以便在用户界面中显示新功能内容。
-
-
维护窗口
-
虽然 PowerStore 群集经过精心设计和测试,可实现完全无中断升级,但仍建议在升级 PowerStore 群集时遵循 IT 管理最佳实践。
-
请尽可能利用维护窗口而不是生产时间,并在群集负载最小时执行升级。
-
如果 PowerStore 设备节点上的 CPU 利用率超过 50%,请在维护时段内减少 I/O 负载。
-
可以在 PowerStore Manager (UI) 中 Performance 选项卡的 Hardware 菜单下查看 CPU 利用率。
-
-
当文件系统数量大于 50 时,可能会有较长的 I/O 暂停时间。请考虑设置维护窗口。
-
这有助于确保在最短的时间内完成升级,并产生最少影响。
-
-
获取帮助
-
如有需要,请联系 Dell Technologies 支持服务部门寻求帮助,以协调和执行 PowerStore 设备的无中断升级 (NDU)。
-
如果您计划对 PowerStore X 环境进行升级,建议您联系 Dell Technologies 支持,以获取升级过程的指导。
-
Dell Technologies 会与您密切合作,确保恰当地安排和执行升级,而不中断业务工作负载。
-
-
支持连接
-
强烈建议启用支持连接和远程服务凭据 (RSC),以便在软件更新过程失败时简化升级失败分析并缩短时长。
-
-
SSH 访问
-
在 PowerStore 设备级别启用外部 SSH 访问,以便在软件更新过程失败时简化升级失败分析并缩短时长。
-
-
服务账户
-
向服务账户添加密码。如果已将密码添加到服务帐户,请验证您是否可以通过 SSH 连接到 PowerStore,并使用用户“service”和为该帐户设置的密码登录。
-
-
CHAP 设置
-
如果您在启用了 NAS 的 PowerStore T 型号群集上更改 CHAP 设置(例如启用或禁用 CHAP、将相互 CHAP 更改为单个 CHAP 或将单个 CHAP 更改为相互 CHAP),则必须执行以下操作:
-
更改 CHAP 设置后尽快重新启动群集节点,每次启动一个。
-
等到所有群集节点都已重新启动,然后再执行软件更新。
-
-
-
禁止呼叫总部警报
-
通常,NDU 过程将自动禁用呼叫总部警报,以便不会为 NDU 期间发生的警报创建服务请求。但是,这可能并不总是按预期激活
- 对于具有一个或多个扩展存储模块的群集,在扩展存储模块升级完成之前,Dial-Home 抑制可能会过早清除
- 有关如何手动抑制呼叫总部警报的详细信息,请参阅知识库000125772: PowerStore:如何禁用测试和计划内维护的支持通知
-
注意:如果在更改 CHAP 设置后未重新启动启用了 NAS 的 PowerStore T 型号群集上的节点,则软件更新将失败。有关重新启动 PowerStore T 型号节点的说明,请参阅《PowerStore 断电和重新启动过程指南》。
一般升级注意事项
- 某些内部系统作(如快照和复制计划)可能会在无中断升级期间暂停,并在无中断升级完成后恢复。
收尾检查
PowerStore 包括各种工具,可帮助诊断和主动识别各种问题。在成功完成无中断升级之后,还应运行这些工具以确认群集不存在任何问题。
在此步骤中,应在无中断升级之后运行“初步检查”部分中介绍的 PowerStore 运行状况检查工具:升级前运行状况检查 (PUHC) 和系统运行状况检查 (SHC)。
请参阅下表,根据您的 PowerStoreOS 版本确定无中断升级后要使用的工具:
|
当前 PowerStoreOS 版本 |
用于评估系统运行状况的工具 |
|---|---|
|
4.x |
|
|
3.x |
|
|
2.1.x |
|
|
2.0.x |
|
此外,在无中断升级之后,请确保上传并安装运行状况检查精简软件包和 RxDefinitions 软件包。这是因为如果这些软件包之前存在,无中断升级过程会删除这些软件包。
有关安装 RxDefinitions 软件包的更多详细信息,请参阅文章 PowerStore:RxDefinitions 问题的登录页面
有关使用这些 PowerStore 工具的说明,请参阅文章 PowerStore:如何使用系统检查功能和 PowerStore:如何使用升级前运行状况检查和系统检查在软件升级前检查群集的运行状况。