PowerFlex 3.5:使用複寫時對等中斷連線
Summary: 設定 PowerFlex 複寫後,對等系統狀態為「解耦」,並顯示「REMOTE_PEER_MDM_DENIED_MESSAGE_AS_NO_WORKING_CLIENT_CONNECTION_TO_THIS_PEER」錯誤訊息。
Symptoms
此問題可能會在設定 PowerFlex 複寫後立即發生,但在部分網路變更後,或任一端的主 MDM 變更為特定節點時,也會出現此問題。
scli --query_replication_peer_system 在一側 (SiteA) 傳回:
query-all-Replication Peer System returned 1 Replication Peer System nodes. Replication Peer System ID: 045a1aa61167b20f Replication Peer System internal ID: eef8648500000000 Name: SiteB State: Decoupled, REMOTE_PEER_MDM_DENIED_MESSAGE_AS_NO_WORKING_CLIENT_CONNECTION_TO_THIS_PEER IP: 192.168.89.14,192.168.89.13,192.168.89.18 Port: 7611 Version: N/A SDR-SDR connectivity status: All connected
「netstat」輸出看起來類似:
tcp 0 0 192.168.86.19:50470 192.168.89.14:7611 ESTABLISHED 36766/mdm-3.5.1100. tcp 0 0 192.168.86.19:50464 192.168.89.14:7611 ESTABLISHED 36766/mdm-3.5.1100. tcp 0 0 192.168.86.19:50216 192.168.89.14:7611 ESTABLISHED 36766/mdm-3.5.1100. tcp 0 0 192.168.86.19:50458 192.168.89.14:7611 ESTABLISHED 36766/mdm-3.5.1100.
請注意,對等 MDM 上有四個到埠 7611 的傳出連接,但沒有從 SiteB 到本地主機上的埠 7611 的傳入連接。
另一端 (SiteB) 顯示為分離,NOT_CONN,例如:
Query-all-Replication Peer System returned 1 Replication Peer System nodes. Replication Peer System ID: 0966250f2fae770f Replication Peer System internal ID: c0f3862b00000000 Name: SiteA State: Decoupled, NOT_CONN IP: 192.168.86.20,192.168.86.13,192.168.86.19 Port: 7611 Version: 3.5.1100 SDR-SDR connectivity status: All connected
這一端的「netstat」輸出可能類似:
B -> A tcp 0 157 192.168.89.14:7611 192.168.86.19:50470 ESTABLISHED 446371/mdm-3.5.1100 tcp 0 0 192.168.89.14:7611 192.168.86.19:50216 ESTABLISHED 446371/mdm-3.5.1100 tcp 0 0 192.168.89.14:7611 192.168.86.19:50464 ESTABLISHED 446371/mdm-3.5.1100 tcp 0 0 192.168.89.14:7611 192.168.86.19:50458 ESTABLISHED 446371/mdm-3.5.1100 tcp 0 0 192.168.89.14:54460 192.168.86.19:7611 SYN_SENT 446371/mdm-3.5.1100 tcp 0 0 192.168.89.14:54456 192.168.86.19:7611 SYN_SENT 446371/mdm-3.5.1100 tcp 0 0 192.168.89.14:54458 192.168.86.19:7611 SYN_SENT 446371/mdm-3.5.1100 tcp 0 0 192.168.89.14:54454 192.168.86.19:7611 SYN_SENT 446371/mdm-3.5.1100
有來自 SiteA (192.168.89.14) 的連線,且來源連接埠號碼與 SiteA 上的「netstat」輸出相符,但傳出連線處於SYN_SENT狀態,這表示它們無法完成與 SiteA 的 TCP 交握,實際上也無法建立 MDM 對等互連。
影響
複寫無法運作 根據根本原因,它可能根本無法運作,或僅當特定節點在一側成為主 MDM 時。
Cause
此問題是由 MDM IP 位址配置錯誤或網站之間的網路問題引起的。例如,如果 SiteA 配置了正確的 IP 位址,但 SiteB 配置了不屬於 SiteA MDM 的 IP,則可能會出現此問題。
如果站點間發生任何網路連線 (防火牆、路由等) 問題,客戶也可能遇到類似的問題。另一個原因是任一端的IP重複(即有兩個MDM使用相同的IP運行)或某種網路設備攔截傳出TCP會話(代理)。
在此特定情況下,SiteB MDM 使 TCP 套接字對網站 A 上的一個 MDM 保持打開狀態,但未連接到該 MDM,而是由網站之間路徑上的路由器之一人為地保持連接活動狀態:
這是兩個網站上的 netstat 輸出的樣子:
A -> B tcp 0 0 192.168.86.19:50470 192.168.89.14:7611 ESTABLISHED 36766/mdm-3.5.1100. tcp 0 0 192.168.86.19:50464 192.168.89.14:7611 ESTABLISHED 36766/mdm-3.5.1100. tcp 0 0 192.168.86.19:50216 192.168.89.14:7611 ESTABLISHED 36766/mdm-3.5.1100. tcp 0 0 192.168.86.19:50458 192.168.89.14:7611 ESTABLISHED 36766/mdm-3.5.1100. B -> A tcp 0 0 192.168.89.14:54460 192.168.86.19:7611 ESTABLISHED 446371/mdm-3.5.1100 tcp 0 0 192.168.89.14:54456 192.168.86.19:7611 ESTABLISHED 446371/mdm-3.5.1100 tcp 0 0 192.168.89.14:54458 192.168.86.19:7611 ESTABLISHED 446371/mdm-3.5.1100 tcp 0 0 192.168.89.14:54454 192.168.86.19:7611 ESTABLISHED 446371/mdm-3.5.1100 tcp6 0 157 192.168.89.14:7611 192.168.86.19:50470 ESTABLISHED 446371/mdm-3.5.1100 tcp6 0 0 192.168.89.14:7611 192.168.86.19:50216 ESTABLISHED 446371/mdm-3.5.1100 tcp6 0 0 192.168.89.14:7611 192.168.86.19:50464 ESTABLISHED 446371/mdm-3.5.1100 tcp6 0 0 192.168.89.14:7611 192.168.86.19:50458 ESTABLISHED 446371/mdm-3.5.1100
請注意,SiteB (192.168.89.14) 顯示與連接埠 7611 上 SiteA (192.168.86.19) 的 IP 位址建立四個連線,但我們在 SiteA 的「netstat」輸出中看不到相同的內容 - 某種網路代理使這些 TCP 工作階段保持活動狀態。
Resolution
修正同儕 MDM IP 組態。測試連接埠 TCP/7611 上網站之間的連線。將主 MDM 擁有權切換至叢集中的不同節點,和/或重新啟動 MDM 服務,以關閉舊插槽。
受影響的版本
PowerFlex 3.5 及更新版本
已修正問題的版本
不適用 - 不是 PowerFlex 問題