PowerFlex 3.5: Peer-frånkoppling när du använder replikering
Summary: När du har konfigurerat PowerFlex-replikering är peer-systemets status "Frikopplad" med felmeddelandet "REMOTE_PEER_MDM_DENIED_MESSAGE_AS_NO_WORKING_CLIENT_CONNECTION_TO_THIS_PEER".
Symptoms
Det här problemet kan uppstå direkt efter att PowerFlex-replikering har konfigurerats, men kan även uppstå efter vissa nätverksändringar eller när Master MDM på vardera sidan ändras till en specifik nod.
scli --query_replication_peer_system på ena sidan (SiteA) returnerar:
query-all-Replication Peer System returned 1 Replication Peer System nodes. Replication Peer System ID: 045a1aa61167b20f Replication Peer System internal ID: eef8648500000000 Name: SiteB State: Decoupled, REMOTE_PEER_MDM_DENIED_MESSAGE_AS_NO_WORKING_CLIENT_CONNECTION_TO_THIS_PEER IP: 192.168.89.14,192.168.89.13,192.168.89.18 Port: 7611 Version: N/A SDR-SDR connectivity status: All connected
"netstat"-utdata ser ut ungefär så här:
tcp 0 0 192.168.86.19:50470 192.168.89.14:7611 ESTABLISHED 36766/mdm-3.5.1100. tcp 0 0 192.168.86.19:50464 192.168.89.14:7611 ESTABLISHED 36766/mdm-3.5.1100. tcp 0 0 192.168.86.19:50216 192.168.89.14:7611 ESTABLISHED 36766/mdm-3.5.1100. tcp 0 0 192.168.86.19:50458 192.168.89.14:7611 ESTABLISHED 36766/mdm-3.5.1100.
Observera att det finns fyra utgående anslutningar till port 7611 på peer-MDM, men det finns inga inkommande anslutningar från SiteB till port 7611 på den lokala värden.
En annan sida (SiteB) visas som Frikopplad, NOT_CONN, till exempel:
Query-all-Replication Peer System returned 1 Replication Peer System nodes. Replication Peer System ID: 0966250f2fae770f Replication Peer System internal ID: c0f3862b00000000 Name: SiteA State: Decoupled, NOT_CONN IP: 192.168.86.20,192.168.86.13,192.168.86.19 Port: 7611 Version: 3.5.1100 SDR-SDR connectivity status: All connected
"netstat"-utdata på den här sidan kan se ut ungefär så här:
B -> A tcp 0 157 192.168.89.14:7611 192.168.86.19:50470 ESTABLISHED 446371/mdm-3.5.1100 tcp 0 0 192.168.89.14:7611 192.168.86.19:50216 ESTABLISHED 446371/mdm-3.5.1100 tcp 0 0 192.168.89.14:7611 192.168.86.19:50464 ESTABLISHED 446371/mdm-3.5.1100 tcp 0 0 192.168.89.14:7611 192.168.86.19:50458 ESTABLISHED 446371/mdm-3.5.1100 tcp 0 0 192.168.89.14:54460 192.168.86.19:7611 SYN_SENT 446371/mdm-3.5.1100 tcp 0 0 192.168.89.14:54456 192.168.86.19:7611 SYN_SENT 446371/mdm-3.5.1100 tcp 0 0 192.168.89.14:54458 192.168.86.19:7611 SYN_SENT 446371/mdm-3.5.1100 tcp 0 0 192.168.89.14:54454 192.168.86.19:7611 SYN_SENT 446371/mdm-3.5.1100
Det finns anslutningar som kommer från SiteA (192.168.89.14) och källportnumren matchar "netstat"-utdata på SiteA, men utgående anslutningar är i SYN_SENT tillstånd, vilket innebär att de inte kan slutföra TCP-handskakningen med SiteA och i praktiken inte kan upprätta MDM-peering.
Effekt
Replikeringen fungerar inte Beroende på grundorsaken kanske den inte fungerar alls eller bara när en specifik nod blir Master MDM på en av sidorna.
Cause
Det här problemet orsakas antingen av felaktig konfiguration av MDM-IP-adresser eller nätverksproblem mellan platser. Om SiteA till exempel har konfigurerats med rätt IP-adresser, men SiteB har konfigurerats med IP-adresser som inte tillhör MDM:er för SiteA, kan det här problemet uppstå.
Om det finns problem med nätverksanslutningen (brandvägg, routning osv.) mellan platserna kan kunden också uppleva ett liknande problem. En annan orsak är duplicerade IP-adresser på någon av sidorna (det vill säga att det finns två MDM:er som körs med samma IP) eller någon form av nätverksenhet som fångar upp utgående TCP-sessioner (proxy).
I det här fallet höll SiteB MDM TCP-sockets öppna mot en av MDM:erna på SiteA, men var inte ansluten till den MDM:en, utan anslutningen hölls artificiellt vid liv av en av routrarna på vägen mellan platserna:
Så här såg netstat-utdata ut på båda sajterna:
A -> B tcp 0 0 192.168.86.19:50470 192.168.89.14:7611 ESTABLISHED 36766/mdm-3.5.1100. tcp 0 0 192.168.86.19:50464 192.168.89.14:7611 ESTABLISHED 36766/mdm-3.5.1100. tcp 0 0 192.168.86.19:50216 192.168.89.14:7611 ESTABLISHED 36766/mdm-3.5.1100. tcp 0 0 192.168.86.19:50458 192.168.89.14:7611 ESTABLISHED 36766/mdm-3.5.1100. B -> A tcp 0 0 192.168.89.14:54460 192.168.86.19:7611 ESTABLISHED 446371/mdm-3.5.1100 tcp 0 0 192.168.89.14:54456 192.168.86.19:7611 ESTABLISHED 446371/mdm-3.5.1100 tcp 0 0 192.168.89.14:54458 192.168.86.19:7611 ESTABLISHED 446371/mdm-3.5.1100 tcp 0 0 192.168.89.14:54454 192.168.86.19:7611 ESTABLISHED 446371/mdm-3.5.1100 tcp6 0 157 192.168.89.14:7611 192.168.86.19:50470 ESTABLISHED 446371/mdm-3.5.1100 tcp6 0 0 192.168.89.14:7611 192.168.86.19:50216 ESTABLISHED 446371/mdm-3.5.1100 tcp6 0 0 192.168.89.14:7611 192.168.86.19:50464 ESTABLISHED 446371/mdm-3.5.1100 tcp6 0 0 192.168.89.14:7611 192.168.86.19:50458 ESTABLISHED 446371/mdm-3.5.1100
Observera att SiteB (192.168.89.14) visar fyra ETABLERADE anslutningar till IP-adressen för SiteA (192.168.86.19) på port 7611, men vi ser inte samma sak i "netstat"-utdata på SiteA - någon form av nätverksproxy höll dessa TCP-sessioner vid liv.
Resolution
Åtgärda IP-konfigurationen för peer MDM. Testa anslutningen mellan platser på port TCP/7611. Byt MDM-huvudägarskap till olika noder i klustret och/eller starta om MDM-tjänsten för att stänga gamla sockets.
Versioner som påverkas
PowerFlex 3.5 och senare
Åtgärdat i version
Ej tillämpligt – inte PowerFlex-problem