PowerFlex 3.5 : Déconnexion de l’homologue lors de l’utilisation de la réplication
Summary: Après la configuration de la réplication PowerFlex, l’état du système homologue est « Découplé » avec le message d’erreur « REMOTE_PEER_MDM_DENIED_MESSAGE_AS_NO_WORKING_CLIENT_CONNECTION_TO_THIS_PEER ». ...
Symptoms
Ce problème peut se produire immédiatement après la configuration de la réplication PowerFlex, mais peut également être observé après certaines modifications du réseau ou lorsque le MDM maître de chaque côté est remplacé par un nœud spécifique.
scli --query_replication_peer_system d’un côté (SiteA) renvoie :
query-all-Replication Peer System returned 1 Replication Peer System nodes. Replication Peer System ID: 045a1aa61167b20f Replication Peer System internal ID: eef8648500000000 Name: SiteB State: Decoupled, REMOTE_PEER_MDM_DENIED_MESSAGE_AS_NO_WORKING_CLIENT_CONNECTION_TO_THIS_PEER IP: 192.168.89.14,192.168.89.13,192.168.89.18 Port: 7611 Version: N/A SDR-SDR connectivity status: All connected
La sortie « netstat » ressemble à :
tcp 0 0 192.168.86.19:50470 192.168.89.14:7611 ESTABLISHED 36766/mdm-3.5.1100. tcp 0 0 192.168.86.19:50464 192.168.89.14:7611 ESTABLISHED 36766/mdm-3.5.1100. tcp 0 0 192.168.86.19:50216 192.168.89.14:7611 ESTABLISHED 36766/mdm-3.5.1100. tcp 0 0 192.168.86.19:50458 192.168.89.14:7611 ESTABLISHED 36766/mdm-3.5.1100.
Notez qu’il existe quatre connexions sortantes vers le port 7611 sur le MDM homologue, mais qu’il n’y a aucune connexion entrante du SiteB vers le port 7611 sur l’hôte local.
Un autre côté (SiteB) s’affiche comme Découplé, NOT_CONN, par exemple :
Query-all-Replication Peer System returned 1 Replication Peer System nodes. Replication Peer System ID: 0966250f2fae770f Replication Peer System internal ID: c0f3862b00000000 Name: SiteA State: Decoupled, NOT_CONN IP: 192.168.86.20,192.168.86.13,192.168.86.19 Port: 7611 Version: 3.5.1100 SDR-SDR connectivity status: All connected
La sortie « netstat » de ce côté peut ressembler à :
B -> A tcp 0 157 192.168.89.14:7611 192.168.86.19:50470 ESTABLISHED 446371/mdm-3.5.1100 tcp 0 0 192.168.89.14:7611 192.168.86.19:50216 ESTABLISHED 446371/mdm-3.5.1100 tcp 0 0 192.168.89.14:7611 192.168.86.19:50464 ESTABLISHED 446371/mdm-3.5.1100 tcp 0 0 192.168.89.14:7611 192.168.86.19:50458 ESTABLISHED 446371/mdm-3.5.1100 tcp 0 0 192.168.89.14:54460 192.168.86.19:7611 SYN_SENT 446371/mdm-3.5.1100 tcp 0 0 192.168.89.14:54456 192.168.86.19:7611 SYN_SENT 446371/mdm-3.5.1100 tcp 0 0 192.168.89.14:54458 192.168.86.19:7611 SYN_SENT 446371/mdm-3.5.1100 tcp 0 0 192.168.89.14:54454 192.168.86.19:7611 SYN_SENT 446371/mdm-3.5.1100
Il existe des connexions provenant du site A (192.168.89.14) et les numéros de port source correspondent à la sortie « netstat » sur le site A, mais les connexions sortantes sont dans un état SYN_SENT, ce qui signifie qu’elles ne peuvent pas terminer l’établissement de la liaison TCP avec SiteA et, de fait, ne peuvent pas établir l’appairage MDM.
Impact
La réplication ne fonctionne pas En fonction de la cause première, il se peut qu’elle ne fonctionne pas du tout ou seulement lorsqu’un nœud spécifique devient le MDM principal sur l’un des côtés.
Cause
Ce problème est dû à une mauvaise configuration de l’adresse IP du MDM ou à des problèmes de réseau entre sites. Par exemple, si SiteA est configuré avec des adresses IP correctes, mais que SiteB a été configuré avec des adresses IP qui n’appartiennent pas aux MDM SiteA, ce problème peut se produire.
En cas de problème de connectivité réseau (pare-feu, routage, etc.) entre les sites, le client peut également rencontrer un problème similaire. Une autre raison est la duplication d’adresses IP sur l’un ou l’autre des côtés (c’est-à-dire qu’il existe deux MDM s’exécutant avec la même adresse IP) ou une sorte de périphérique réseau interceptant les sessions TCP sortantes (proxy).
Dans ce cas particulier, le MDM du site B a maintenu les sockets TCP ouverts sur l’un des MDM du site A, mais n’a pas été connecté à ce MDM. Au lieu de cela, la connexion a été artificiellement maintenue active par l’un des routeurs sur le chemin entre les sites :
Voici à quoi ressemblait la sortie netstat sur les deux sites :
A -> B tcp 0 0 192.168.86.19:50470 192.168.89.14:7611 ESTABLISHED 36766/mdm-3.5.1100. tcp 0 0 192.168.86.19:50464 192.168.89.14:7611 ESTABLISHED 36766/mdm-3.5.1100. tcp 0 0 192.168.86.19:50216 192.168.89.14:7611 ESTABLISHED 36766/mdm-3.5.1100. tcp 0 0 192.168.86.19:50458 192.168.89.14:7611 ESTABLISHED 36766/mdm-3.5.1100. B -> A tcp 0 0 192.168.89.14:54460 192.168.86.19:7611 ESTABLISHED 446371/mdm-3.5.1100 tcp 0 0 192.168.89.14:54456 192.168.86.19:7611 ESTABLISHED 446371/mdm-3.5.1100 tcp 0 0 192.168.89.14:54458 192.168.86.19:7611 ESTABLISHED 446371/mdm-3.5.1100 tcp 0 0 192.168.89.14:54454 192.168.86.19:7611 ESTABLISHED 446371/mdm-3.5.1100 tcp6 0 157 192.168.89.14:7611 192.168.86.19:50470 ESTABLISHED 446371/mdm-3.5.1100 tcp6 0 0 192.168.89.14:7611 192.168.86.19:50216 ESTABLISHED 446371/mdm-3.5.1100 tcp6 0 0 192.168.89.14:7611 192.168.86.19:50464 ESTABLISHED 446371/mdm-3.5.1100 tcp6 0 0 192.168.89.14:7611 192.168.86.19:50458 ESTABLISHED 446371/mdm-3.5.1100
Notez que SiteB (192.168.89.14) affiche quatre connexions ÉTABLIES à l’adresse IP de SiteA (192.168.86.19) sur le port 7611, mais nous ne voyons pas la même chose dans la sortie « netstat » sur SiteA - une sorte de proxy réseau a maintenu ces sessions TCP en vie.
Resolution
Corrigez la configuration de l’adresse IP du MDM homologue. Testez la connectivité entre les sites sur le port TCP/7611. Basculez la propriété du MDM maître sur différents nœuds du cluster et/ou redémarrez le service MDM afin de fermer les anciens sockets.
Versions affectées
PowerFlex 3.5 et versions ultérieures
Problème résolu dans la version
S/O : pas de problème PowerFlex