PowerFlex 3.5: Rozłączenie równorzędne podczas korzystania z replikacji
Summary: Po skonfigurowaniu replikacji PowerFlex stan systemu równorzędnego to "Rozłączony" z komunikatem o błędzie "REMOTE_PEER_MDM_DENIED_MESSAGE_AS_NO_WORKING_CLIENT_CONNECTION_TO_THIS_PEER". ...
Symptoms
Ten problem może wystąpić od razu po skonfigurowaniu replikacji PowerFlex, ale można go również zauważyć po pewnych zmianach w sieci lub po zmianie głównego MDM po dowolnej stronie na określony węzeł.
scli --query_replication_peer_system z jednej strony (SiteA) zwraca:
query-all-Replication Peer System returned 1 Replication Peer System nodes. Replication Peer System ID: 045a1aa61167b20f Replication Peer System internal ID: eef8648500000000 Name: SiteB State: Decoupled, REMOTE_PEER_MDM_DENIED_MESSAGE_AS_NO_WORKING_CLIENT_CONNECTION_TO_THIS_PEER IP: 192.168.89.14,192.168.89.13,192.168.89.18 Port: 7611 Version: N/A SDR-SDR connectivity status: All connected
Dane wyjściowe polecenia "netstat" wyglądają podobnie do:
tcp 0 0 192.168.86.19:50470 192.168.89.14:7611 ESTABLISHED 36766/mdm-3.5.1100. tcp 0 0 192.168.86.19:50464 192.168.89.14:7611 ESTABLISHED 36766/mdm-3.5.1100. tcp 0 0 192.168.86.19:50216 192.168.89.14:7611 ESTABLISHED 36766/mdm-3.5.1100. tcp 0 0 192.168.86.19:50458 192.168.89.14:7611 ESTABLISHED 36766/mdm-3.5.1100.
Zwróć uwagę, że istnieją cztery połączenia wychodzące do portu 7611 w równorzędnym MDM, ale nie ma połączeń przychodzących z lokacji B do portu 7611 na hoście lokalnym.
Druga strona (SiteB) jest wyświetlana jako Rozłączona, NOT_CONN na przykład:
Query-all-Replication Peer System returned 1 Replication Peer System nodes. Replication Peer System ID: 0966250f2fae770f Replication Peer System internal ID: c0f3862b00000000 Name: SiteA State: Decoupled, NOT_CONN IP: 192.168.86.20,192.168.86.13,192.168.86.19 Port: 7611 Version: 3.5.1100 SDR-SDR connectivity status: All connected
Dane wyjściowe "netstat" po tej stronie mogą wyglądać podobnie do:
B -> A tcp 0 157 192.168.89.14:7611 192.168.86.19:50470 ESTABLISHED 446371/mdm-3.5.1100 tcp 0 0 192.168.89.14:7611 192.168.86.19:50216 ESTABLISHED 446371/mdm-3.5.1100 tcp 0 0 192.168.89.14:7611 192.168.86.19:50464 ESTABLISHED 446371/mdm-3.5.1100 tcp 0 0 192.168.89.14:7611 192.168.86.19:50458 ESTABLISHED 446371/mdm-3.5.1100 tcp 0 0 192.168.89.14:54460 192.168.86.19:7611 SYN_SENT 446371/mdm-3.5.1100 tcp 0 0 192.168.89.14:54456 192.168.86.19:7611 SYN_SENT 446371/mdm-3.5.1100 tcp 0 0 192.168.89.14:54458 192.168.86.19:7611 SYN_SENT 446371/mdm-3.5.1100 tcp 0 0 192.168.89.14:54454 192.168.86.19:7611 SYN_SENT 446371/mdm-3.5.1100
Istnieją połączenia wychodzące z lokacji A (192.168.89.14), a numery portów źródłowych są zgodne z danymi wyjściowymi "netstat" na lokacji A, ale połączenia wychodzące są w SYN_SENT stanie, co oznacza, że nie można zakończyć uzgadniania TCP z lokacją SiteA, a w efekcie nie można ustanowić komunikacji równorzędnej MDM.
Wpływ
Replikacja nie działa W zależności od głównej przyczyny może nie działać w ogóle lub tylko wtedy, gdy określony węzeł stanie się głównym MDM po jednej ze stron.
Cause
Ten problem jest spowodowany błędną konfiguracją adresu IP MDM lub problemami z siecią między lokacjami. Ten problem może wystąpić na przykład, jeśli witryna SiteA jest skonfigurowana z poprawnymi adresami IP, ale witryna SiteB została skonfigurowana z adresami IP, które nie należą do MDM witryny SiteA.
Jeśli występuje jakikolwiek problem z łącznością sieciową (zapora sieciowa, routing itp.) między lokalizacjami, klient może również napotkać podobny problem. Innym powodem są zduplikowane adresy IP po obu stronach (to znaczy, że istnieją dwa MDM działające z tym samym adresem IP) lub jakieś urządzenie sieciowe przechwytujące wychodzące sesje TCP (proxy).
W tym konkretnym przypadku SiteB MDM utrzymywał gniazda TCP otwarte na jednym z MDM na lokacji A, ale nie był połączony z tym MDM, a połączenie było sztucznie utrzymywane przy życiu przez jeden z routerów na ścieżce między lokacjami:
Tak wyglądał wynik netstat na obu stronach:
A -> B tcp 0 0 192.168.86.19:50470 192.168.89.14:7611 ESTABLISHED 36766/mdm-3.5.1100. tcp 0 0 192.168.86.19:50464 192.168.89.14:7611 ESTABLISHED 36766/mdm-3.5.1100. tcp 0 0 192.168.86.19:50216 192.168.89.14:7611 ESTABLISHED 36766/mdm-3.5.1100. tcp 0 0 192.168.86.19:50458 192.168.89.14:7611 ESTABLISHED 36766/mdm-3.5.1100. B -> A tcp 0 0 192.168.89.14:54460 192.168.86.19:7611 ESTABLISHED 446371/mdm-3.5.1100 tcp 0 0 192.168.89.14:54456 192.168.86.19:7611 ESTABLISHED 446371/mdm-3.5.1100 tcp 0 0 192.168.89.14:54458 192.168.86.19:7611 ESTABLISHED 446371/mdm-3.5.1100 tcp 0 0 192.168.89.14:54454 192.168.86.19:7611 ESTABLISHED 446371/mdm-3.5.1100 tcp6 0 157 192.168.89.14:7611 192.168.86.19:50470 ESTABLISHED 446371/mdm-3.5.1100 tcp6 0 0 192.168.89.14:7611 192.168.86.19:50216 ESTABLISHED 446371/mdm-3.5.1100 tcp6 0 0 192.168.89.14:7611 192.168.86.19:50464 ESTABLISHED 446371/mdm-3.5.1100 tcp6 0 0 192.168.89.14:7611 192.168.86.19:50458 ESTABLISHED 446371/mdm-3.5.1100
Zauważ, że SiteB (192.168.89.14) pokazuje cztery USTANOWIONE połączenia z adresem IP SiteA (192.168.86.19) na porcie 7611, ale nie widzimy tego samego w danych wyjściowych "netstat" na SiteA — jakiś rodzaj sieciowego serwera proxy utrzymywał te sesje TCP przy życiu.
Resolution
Napraw konfigurację równorzędnych adresów IP MDM. Przetestuj łączność między lokacjami na porcie TCP/7611. Przełącz główną własność MDM na inne węzły w klastrze i/lub uruchom ponownie usługę MDM, aby zamknąć stare gniazda.
Wersje, których dotyczy problem
PowerFlex 3.5 i nowsze
Naprawiono w wersji
Nie dotyczy — nie jest to problem z PowerFlex