Dell Unity:升级期间主 SP 重新启动后 Unity 无法访问

Summary: 本文介绍升级期间主 SP 重新启动后 Unity 管理服务变得无法访问的原因。 (用户可纠正)

This article applies to This article does not apply to This article is not tied to any specific product. Not all product versions are identified in this article.

Symptoms

主 SP 在升级过程中重新启动。

在代码升级过程的主 SP 重新启动期间,Unity 管理服务无法访问。

Unity IP 不可 ping 通,Unisphere 也无法加载。

数据访问不受影响。

Cause

在 Unity 中,主 SP 处理管理服务(IP 地址)。
当主 SP 重新启动时,管理服务将故障切换到辅助(对等)SP。

问题 1:
如果辅助 SP 未连接到与主 SP 相同的管理网络,则当管理服务故障切换时,Unity IP 将变得不可访问。

例:
升级之前:
  • SP A 是主 SP,SP B 是辅助
  • SP A 连接到从中访问 Unisphere 的管理网络。
  • SP B 未连接到与 SP A 相同的网络。
在升级期间 SP A 重新启动时:
  • SP B 变为主 SP,SP A 变为辅助 SP。
  • 由于管理服务跟随 SP B,因此 Unity 管理 IP 无法访问。
问题 2:
当 SP 之间的故障切换发生并且我们假冒新 SP 上的 MAC 地址时,可能会出现第二个问题。某些用户环境可能会获取新的“重复”MAC 地址并阻止对交换机端口的访问,从而导致访问丢失。
 
提醒:Unity OE 5.3 及更高版本中引入了新的升级前运行状况检查 (PUHC) 实用程序增强功能。

此增强功能会检查管理端口上可能出现的连接问题。请参阅 Dell Unity:升级前运行状况检查完成,但显示警告:platform::check_management_port_2(用户可纠正)
Test of the management port configuration indicates there may be a problem with the management port VLAN settings that could cause loss of management functionality during storage processor reboots associated with the upgrade. Some valid network configurations can also make this test fail. Ensure that the alternate management port is properly configured. See KB#000066048 for recommended VLAN management port guidelines. You can safely ignore this warning if there is not a real issue.
PUHC 警告的用户界面屏幕截图:


新 PUHC 警告的屏幕截图
此警告消息指示 Unity 阵列无法确认对等存储处理器 (SP) 的管理网络连接。新的 Unity OE 5.3 PUHC 增强功能可启动对网络的地址解析协议 (ARP) 探测。这是为了确认对等 SP 上出现任何连接问题,在事件管理操作故障切换到对等 SP 时。

PUHC 发送 ARP 探测,而不是标准 ARP ping。管理 IP 地址仅在主 SP 上处于活动状态,而在对等 SP 上不处于活动状态。这就是检查必须是对等方的 ARP 探测的原因。非主(对等)SP 没有为标准 ARP 配置的 IP 地址。因此,ARP请求必须在填充0.0.0.0的情况下发送,并且是ARP探测。

如果未从 ARP 探测收到响应,则会显示警告消息。

此警告并不意味着在升级之前,一个 SP 管理端口的端口链路已关闭。如果这是问题所在,则升级前运行状况检查会发现它(如戴尔文章 Dell Unity:运行状况检查失败并显示 [错误代码:platform::check_peer_management_port_link_2](用户可纠正)

Resolution

在升级前的 PUHC 期间:
以下警告消息是软警告,而不是故障:
Warning Code: platform::check_management_port_2
使用以下文章中的选项之一将管理操作故障切换到对等 SP,以测试对等 SP 是否与网络连接。Dell Unity:如何执行管理服务 (ECOM) 故障切换(戴尔可纠正)

本文的另一个选项是重新启动当前的主 SP,以将管理操作故障切换到对等 SP。在故障切换过程中,管理操作可能会丢失长达 10 分钟。恢复管理操作后,验证对等 SP 现在是否是主 SP。如果在故障切换测试后管理操作在 SPA 和 SPB 上成功运行,则可以安全地忽略此警告消息。

在升级过程中:
如果直到升级过程中才看到此警告,则可以忽略此警告。单击“重试”按钮以继续升级。  

如果“重试”按钮不起作用,请联系 戴尔支持并引用此知识库文章。

成功升级后:
以下警告
Warning Code: platform::check_management_port_2
如果在成功升级到 Unity OE 5.3 或更高版本后收到此警告消息,则可以安全地忽略。

Additional Information

此知识库文章适用于所有主 SP 重新启动的情况,而不仅仅是升级。

问题示例: 
  • 在一种情况下,一个 SP 连接到管理网络,而另一个 SP 管理线缆插入一台 iSCSI 交换机。
  • 在另一种情况下,一个 SP 连接到管理网络,而另一条 SP 管理线缆插入交换机端口,通过其他 VLAN 连接到另一个网络。
从 Unity OE 版本 5.3 开始,新测试是升级前运行状况检查 (PUHC) 实用程序的一部分,用于检查此情况。  此测试将检查主要 SP 和次要 SP。  新测试(与我们检查以确保端口未关闭的当前测试不同)将使用“arp ping”(arping)实用程序来测试接口是否允许通过其接口进行地址解析协议 (ARP) 流量。  通常,交换机配置为跨 VLAN 阻止 ARP 广播,因此在大多数情况下,此测试将可靠地确定管理端口的 VLAN 是否已正确配置。  如果交换机配置为允许跨 VLAN 进行广播,则此测试可能会产生误报,并且在禁用广播时(即使在 VLAN 中)时,该测试可能会产生误报。  但在大多数情况下,在正常情况下,此新测试将确定管理端口是否在 VLAN 中正确配置。

Affected Products

Dell EMC Unity Family

Products

Dell EMC Unity Family |Dell EMC Unity All Flash, Dell EMC Unity Family, Dell EMC Unity Hybrid
Article Properties
Article Number: 000066048
Article Type: Solution
Last Modified: 21 Jun 2024
Version:  8
Find answers to your questions from other Dell users
Support Services
Check if your device is covered by Support Services.