PowerFlex 3.5:使用复制时对等断开连接
Summary: 配置 PowerFlex 复制后,对等系统状态为“Decoupled”,并显示“REMOTE_PEER_MDM_DENIED_MESSAGE_AS_NO_WORKING_CLIENT_CONNECTION_TO_THIS_PEER”错误消息。
Symptoms
在配置 PowerFlex 复制后,此问题可能会立即发生,但也可能会在一些网络更改后或任一端的主 MDM 更改为特定节点时出现。
scli --query_replication_peer_system 在一侧 (SiteA) 返回:
query-all-Replication Peer System returned 1 Replication Peer System nodes. Replication Peer System ID: 045a1aa61167b20f Replication Peer System internal ID: eef8648500000000 Name: SiteB State: Decoupled, REMOTE_PEER_MDM_DENIED_MESSAGE_AS_NO_WORKING_CLIENT_CONNECTION_TO_THIS_PEER IP: 192.168.89.14,192.168.89.13,192.168.89.18 Port: 7611 Version: N/A SDR-SDR connectivity status: All connected
“netstat”输出类似于以下内容:
tcp 0 0 192.168.86.19:50470 192.168.89.14:7611 ESTABLISHED 36766/mdm-3.5.1100. tcp 0 0 192.168.86.19:50464 192.168.89.14:7611 ESTABLISHED 36766/mdm-3.5.1100. tcp 0 0 192.168.86.19:50216 192.168.89.14:7611 ESTABLISHED 36766/mdm-3.5.1100. tcp 0 0 192.168.86.19:50458 192.168.89.14:7611 ESTABLISHED 36766/mdm-3.5.1100.
请注意,有四个到对等 MDM 上的端口 7611 的传出连接,但没有从 SiteB 到本地主机上端口 7611 的传入连接。
另一端 (SiteB) 显示为“Decoupled”NOT_CONN,例如:
Query-all-Replication Peer System returned 1 Replication Peer System nodes. Replication Peer System ID: 0966250f2fae770f Replication Peer System internal ID: c0f3862b00000000 Name: SiteA State: Decoupled, NOT_CONN IP: 192.168.86.20,192.168.86.13,192.168.86.19 Port: 7611 Version: 3.5.1100 SDR-SDR connectivity status: All connected
这一端的“netstat”输出可能类似于:
B -> A tcp 0 157 192.168.89.14:7611 192.168.86.19:50470 ESTABLISHED 446371/mdm-3.5.1100 tcp 0 0 192.168.89.14:7611 192.168.86.19:50216 ESTABLISHED 446371/mdm-3.5.1100 tcp 0 0 192.168.89.14:7611 192.168.86.19:50464 ESTABLISHED 446371/mdm-3.5.1100 tcp 0 0 192.168.89.14:7611 192.168.86.19:50458 ESTABLISHED 446371/mdm-3.5.1100 tcp 0 0 192.168.89.14:54460 192.168.86.19:7611 SYN_SENT 446371/mdm-3.5.1100 tcp 0 0 192.168.89.14:54456 192.168.86.19:7611 SYN_SENT 446371/mdm-3.5.1100 tcp 0 0 192.168.89.14:54458 192.168.86.19:7611 SYN_SENT 446371/mdm-3.5.1100 tcp 0 0 192.168.89.14:54454 192.168.86.19:7611 SYN_SENT 446371/mdm-3.5.1100
有来自 SiteA (192.168.89.14) 的连接,源端口号与 SiteA 上的“netstat”输出匹配,但传出连接处于SYN_SENT状态,这意味着它们无法完成与 SiteA 的 TCP 握手,实际上无法建立 MDM 对等。
冲击
复制不起作用 根据根本原因,它可能根本不起作用,或者仅当特定节点在一端成为主 MDM 时才起作用。
Cause
此问题是由 MDM IP 地址配置错误或站点之间的网络问题引起的。例如,如果 SiteA 配置了正确的 IP 地址,但 SiteB 配置了不属于 SiteA MDM 的 IP,则可能会出现此问题。
如果站点之间存在任何网络连接(防火墙、路由等)问题,客户也可能会遇到类似的问题。另一个原因是任一端的 IP 重复(即有两个 MDM 使用相同的 IP 运行)或某种网络设备拦截传出 TCP 会话(代理)。
在此特定情况下,SiteB MDM 针对 SiteA 上的一个 MDM 保持 TCP 套接字处于打开状态,但未连接到该 MDM,而是由站点间路径上的一个路由器人为地保持连接活动状态:
这是两个站点上 netstat 输出的样子:
A -> B tcp 0 0 192.168.86.19:50470 192.168.89.14:7611 ESTABLISHED 36766/mdm-3.5.1100. tcp 0 0 192.168.86.19:50464 192.168.89.14:7611 ESTABLISHED 36766/mdm-3.5.1100. tcp 0 0 192.168.86.19:50216 192.168.89.14:7611 ESTABLISHED 36766/mdm-3.5.1100. tcp 0 0 192.168.86.19:50458 192.168.89.14:7611 ESTABLISHED 36766/mdm-3.5.1100. B -> A tcp 0 0 192.168.89.14:54460 192.168.86.19:7611 ESTABLISHED 446371/mdm-3.5.1100 tcp 0 0 192.168.89.14:54456 192.168.86.19:7611 ESTABLISHED 446371/mdm-3.5.1100 tcp 0 0 192.168.89.14:54458 192.168.86.19:7611 ESTABLISHED 446371/mdm-3.5.1100 tcp 0 0 192.168.89.14:54454 192.168.86.19:7611 ESTABLISHED 446371/mdm-3.5.1100 tcp6 0 157 192.168.89.14:7611 192.168.86.19:50470 ESTABLISHED 446371/mdm-3.5.1100 tcp6 0 0 192.168.89.14:7611 192.168.86.19:50216 ESTABLISHED 446371/mdm-3.5.1100 tcp6 0 0 192.168.89.14:7611 192.168.86.19:50464 ESTABLISHED 446371/mdm-3.5.1100 tcp6 0 0 192.168.89.14:7611 192.168.86.19:50458 ESTABLISHED 446371/mdm-3.5.1100
请注意,SiteB (192.168.89.14) 在端口 7611 上显示与 SiteA (192.168.86.19) 的 IP 地址的四个 ESTABLISHED 连接,但我们在 SiteA 上的“netstat”输出中没有看到相同的连接 - 某种网络代理使这些 TCP 会话保持活动状态。
Resolution
修复对等 MDM IP 配置。在端口 TCP/7611 上测试站点之间的连接。将主 MDM 所有权切换到群集中的其他节点和/或重新启动 MDM 服务,以便关闭旧插槽。
受影响的版本
PowerFlex 3.5 及更高版本
已修复问题的版本
不适用 — 不是 PowerFlex 问题