PowerFlex 3.5: Odpojení partnera při použití replikace
Summary: Po nakonfigurování replikace PowerFlex se stav partnerského systému zobrazí "Odděleno" a zobrazuje se chybová zpráva "REMOTE_PEER_MDM_DENIED_MESSAGE_AS_NO_WORKING_CLIENT_CONNECTION_TO_THIS_PEER". ...
Symptoms
K tomuto problému může dojít ihned po konfiguraci replikace PowerFlex, ale může se projevit také po určitých změnách sítě nebo při změně hlavního uzlu MDM na obou stranách na konkrétní uzel.
scli --query_replication_peer_system na jedné straně (SiteA) vrací:
query-all-Replication Peer System returned 1 Replication Peer System nodes. Replication Peer System ID: 045a1aa61167b20f Replication Peer System internal ID: eef8648500000000 Name: SiteB State: Decoupled, REMOTE_PEER_MDM_DENIED_MESSAGE_AS_NO_WORKING_CLIENT_CONNECTION_TO_THIS_PEER IP: 192.168.89.14,192.168.89.13,192.168.89.18 Port: 7611 Version: N/A SDR-SDR connectivity status: All connected
Výstup "netstat" vypadá nějak takto:
tcp 0 0 192.168.86.19:50470 192.168.89.14:7611 ESTABLISHED 36766/mdm-3.5.1100. tcp 0 0 192.168.86.19:50464 192.168.89.14:7611 ESTABLISHED 36766/mdm-3.5.1100. tcp 0 0 192.168.86.19:50216 192.168.89.14:7611 ESTABLISHED 36766/mdm-3.5.1100. tcp 0 0 192.168.86.19:50458 192.168.89.14:7611 ESTABLISHED 36766/mdm-3.5.1100.
Všimněte si, že v partnerské službě MDM existují čtyři odchozí připojení k portu 7611, ale neexistují žádná příchozí připojení z lokality B na port 7611 na místním hostiteli.
Jiná strana (SiteB) se zobrazuje jako oddělená, NOT_CONN, například:
Query-all-Replication Peer System returned 1 Replication Peer System nodes. Replication Peer System ID: 0966250f2fae770f Replication Peer System internal ID: c0f3862b00000000 Name: SiteA State: Decoupled, NOT_CONN IP: 192.168.86.20,192.168.86.13,192.168.86.19 Port: 7611 Version: 3.5.1100 SDR-SDR connectivity status: All connected
Výstup "netstat" na této straně může vypadat nějak takto:
B -> A tcp 0 157 192.168.89.14:7611 192.168.86.19:50470 ESTABLISHED 446371/mdm-3.5.1100 tcp 0 0 192.168.89.14:7611 192.168.86.19:50216 ESTABLISHED 446371/mdm-3.5.1100 tcp 0 0 192.168.89.14:7611 192.168.86.19:50464 ESTABLISHED 446371/mdm-3.5.1100 tcp 0 0 192.168.89.14:7611 192.168.86.19:50458 ESTABLISHED 446371/mdm-3.5.1100 tcp 0 0 192.168.89.14:54460 192.168.86.19:7611 SYN_SENT 446371/mdm-3.5.1100 tcp 0 0 192.168.89.14:54456 192.168.86.19:7611 SYN_SENT 446371/mdm-3.5.1100 tcp 0 0 192.168.89.14:54458 192.168.86.19:7611 SYN_SENT 446371/mdm-3.5.1100 tcp 0 0 192.168.89.14:54454 192.168.86.19:7611 SYN_SENT 446371/mdm-3.5.1100
Existují připojení přicházející ze sítě A (192.168.89.14) a čísla zdrojových portů odpovídají výstupu příkazu "netstat" v lokalitě A, ale odchozí připojení jsou ve stavu SYN_SENT, což znamená, že nemohou dokončit metodu handshake protokolu TCP s lokalitou A a ve skutečnosti nemohou navázat partnerský vztah MDM.
Dopad
Replikace nefunguje V závislosti na hlavní příčině nemusí fungovat vůbec nebo jen v případě, že se konkrétní uzel na jedné z stran stane hlavním uzlem MDM.
Cause
Tento problém je způsoben chybnou konfigurací IP adresy MDM nebo problémy se sítí mezi lokalitami. K tomuto problému může dojít například v případě, že je lokalita SiteA nakonfigurována se správnými adresami IP, ale lokalita Site B byla nakonfigurována s IP adresami, které nepatří do uzlů MDM lokality SiteA.
Pokud se mezi pracovišti vyskytne problém se síťovým připojením (firewall, směrování atd.), může se zákazník setkat s podobným problémem. Dalším důvodem jsou duplicitní IP adresy na obou stranách (to znamená, že existují dva MDM běžící se stejnou IP adresou) nebo nějaký druh síťového zařízení zachycujícího odchozí relace TCP (proxy).
V tomto konkrétním případě uzel MDM typu SiteB udržoval sokety TCP otevřené pro jeden z uzlů MDM v lokalitě A, ale nebyl k tomuto uzlu MDM připojen. Připojení bylo uměle udržováno naživu jedním ze směrovačů na cestě mezi lokalitami:
Takto vypadal výstup netstat na obou webech:
A -> B tcp 0 0 192.168.86.19:50470 192.168.89.14:7611 ESTABLISHED 36766/mdm-3.5.1100. tcp 0 0 192.168.86.19:50464 192.168.89.14:7611 ESTABLISHED 36766/mdm-3.5.1100. tcp 0 0 192.168.86.19:50216 192.168.89.14:7611 ESTABLISHED 36766/mdm-3.5.1100. tcp 0 0 192.168.86.19:50458 192.168.89.14:7611 ESTABLISHED 36766/mdm-3.5.1100. B -> A tcp 0 0 192.168.89.14:54460 192.168.86.19:7611 ESTABLISHED 446371/mdm-3.5.1100 tcp 0 0 192.168.89.14:54456 192.168.86.19:7611 ESTABLISHED 446371/mdm-3.5.1100 tcp 0 0 192.168.89.14:54458 192.168.86.19:7611 ESTABLISHED 446371/mdm-3.5.1100 tcp 0 0 192.168.89.14:54454 192.168.86.19:7611 ESTABLISHED 446371/mdm-3.5.1100 tcp6 0 157 192.168.89.14:7611 192.168.86.19:50470 ESTABLISHED 446371/mdm-3.5.1100 tcp6 0 0 192.168.89.14:7611 192.168.86.19:50216 ESTABLISHED 446371/mdm-3.5.1100 tcp6 0 0 192.168.89.14:7611 192.168.86.19:50464 ESTABLISHED 446371/mdm-3.5.1100 tcp6 0 0 192.168.89.14:7611 192.168.86.19:50458 ESTABLISHED 446371/mdm-3.5.1100
Všimněte si, že SiteB (192.168.89.14) ukazuje čtyři NAVÁZANÁ připojení k IP adrese SiteA (192.168.86.19) na portu 7611, ale nevidíme to samé ve výstupu "netstat" na SiteA – nějaký druh síťového proxy serveru udržoval tyto relace TCP naživu.
Resolution
Opravte konfiguraci IP adresy partnerského MDM. Otestujte připojení mezi lokalitami na portu TCP/7611. Přepněte vlastnictví hlavního uzlu MDM na jiné uzly v clusteru nebo restartujte službu MDM, aby se uzavřely staré sokety.
Dotčené verze
PowerFlex 3.5 a vyšší
Opraveno ve verzi
Není k dispozici – nikoli problém s řešením PowerFlex