Dell Unity : État de réplication synchrone Perte de communication de synchronisation (0x840e)
Summary: La réplication synchrone a été créée avec succès, mais elle perd immédiatement la synchronisation. Le problème peut se présenter sur le SPA, le SPB ou les deux. (Corrigible par l’utilisateur) ...
Symptoms
La modification du zonage FC a été effectuée pour résoudre les connexions FC croisées entre les processeurs de stockage SRC et les processeurs de stockage DR.
- Une session de réplication synchrone a été créée avec succès, mais elle perd immédiatement la synchronisation.
- Le problème pouvait se produire sur le SPA, le SPB ou les deux.
- Lorsqu’un problème se produit sur un seul SP, la session peut être déplacée vers l’autre SP et cela fonctionne correctement.
Cause
- Après examen des connexions FC, il a été constaté que les connexions étaient croisées et la modification de la connexion FC et du zonage a été refaite pour permettre des connexions SPA <=> SPA et SPB <=> SPB correctes.
- Même après la correction des connexions FC, sans redémarrer les processeurs de stockage sur SRC et DR, la session de réplication synchrone signale toujours la perte de communication de synchronisation. Mais l’interconnexion est correcte.
Resolution
Avec la réplication synchrone où les connexions FC et le zonage ont été effectués, assurez-vous de redémarrer les deux processeurs de stockage sur SRC et DR.
Pour référence, les modifications proposées sont les suivantes. Les éléments suivants sont mis à jour dans la future documentation pour « Configuration de la réplication » :
Configuration
du zonage Veillez à effectuer les opérations suivantes :
- Configurez le port comme un port F pour éviter tout problème potentiel et supprimez les autres types de ports de la liste des types de port autorisés.
- Pour une connexion de réplication synchrone, connectez le port SPA du système source au port SPA du système de destination. De même, le port SPB du système source vers le port SPB du système de destination
Par exemple :
- Port SPA OB_H1450 4 <: port> SPA OB_H1443 4
- Port SPB 4 <OB_H1450 --> Port SPB OB_H1443 4
Si la configuration Fibre Channel est corrigée à partir d’une configuration croisée incorrecte.
Par exemple, la configuration Fibre Channel a été configurée de manière incorrecte :
- Port <SPA 4 OB_H1450 : port> SPB OB_H1443 4
- Port SPB OB_H1450 4 <:> port SPA OB_H1443 4
Maintenant, la configuration est corrigée :
- Port SPA OB_H1450 4 <: port> SPA OB_H1443 4
- Port SPB 4 <OB_H1450 --> Port SPB OB_H1443 4
Assurez-vous de redémarrer le SP du système source et du système de destination.
Les ports SPA et SPB du même côté (source ou destination) doivent avoir une configuration de port identique. Toutefois, la configuration des ports sur le système source peut être différente de la configuration des ports sur le système de destination. Par exemple, le port SPA 4 <--> Module 0 d’E/S SPA port 0 et le port SPB 4 <--> Port 0 du module d’E/S SPB 0 sont pris en charge.
Additional Information
Exemple : Le problème suivant a été observé uniquement sur une réplication Syn Replication de serveur NAS sur SPB où la topologie des connexions FC est SRC FC switch <> Core FC switch <> DR FC switch.
SRC: APMxxx1 DR: APMxxx0 2: ID = RS_5 Name = unitySync Address = x.b.8.115 Alternate Management Address = x.b.8.115 Model = Unity 400 Serial number = APMxxx0 Connection type = sync Source interfaces = x.a.0.80, x.a.0.81 Local interfaces = x.a.0.80, x.a.0.81 Remote interfaces = x.b.8.130, x.b.8.131 Operational status = OK (0x2) Health state = OK (5) Health details = "Communication with the replication host is established. No action is required." Synchronous FC ports = spa_fc4, spb_fc4 | nasServer | x.x.x.2 x.x.x.2 | Not Configured | B | bond10 bond10 | 0x180000001B | 27 | 25 | TRUE | NFS | Name = rep_sess_nas_25_nas_34_APMxxx1_APMxxx0 Session type = nas server Synchronization type = sync RPO = N/A Resource type = NAS Server Sync State = out of sync Health state = Minor failure (15) Health details = "The connection with this remote replication host has been lost. On the Replication Connections page, click the Verify and Update Connection button. Operational status = Lost Sync Communication (0x840e) Source status = OK Destination status = OK Network status = Lost Sync communication Destination type = remote Destination system = RS_5 Local role = Source Source resource = nas_25 Source SP-A interface = x.a.0.80 Source SP-B interface = x.a.0.81 Destination resource = nas_34 Destination SP-A interface = x.b.8.130 Destination SP-B interface = x.b.8.131 Time of last sync = N/A Sync status = Sync transfer rate = N/A Sync transfer size remaining = N/A Previous transfer rate = N/A Average transfer rate = N/A Element pairs = N/A Hourly Snapshot Retention = Daily Snapshot Retention = Hourly snapshot keep for = Hourly snapshot allow auto-delete = Daily snapshot keep for = Daily snapshot allow auto-delete =
EMCSystemLogFile.log :
"2019-02-06T05:43:40.593Z" "Unity_spb" "Kittyhawk_safe" "17322" "unix/spb/root" "INFO" "1:1050207" :: "The minimum requirements for an active mirror have been met. Placing mirror 50060160c7e05f0d:3a000000000000xx in the active state automatically." :: Category=System Component=rmd
"2019-02-06T05:43:40.605Z" "Unity_spb" "Kittyhawk_safe" "17322" "unix/spb/root" "INFO" "1:1050210" :: "Full synchronization has started on image 50060160c7e068xx of the synchronous mirror with ID 50060160c7e05f0d:3a000000000000xx." :: Category=System Component=rmd
"2019-02-06T05:43:40.622Z" "Unity_spb" "Kittyhawk_safe" "17322" "unix/spb/root" "INFO" "1:1050401" :: "K10 50060160c7e068xx became unreachable." :: Category=System Component=rmd
"2019-02-06T05:43:40.633Z" "Unity_spb" "Kittyhawk_safe" "17322" "unix/spb/root" "INFO" "1:1050208" :: "The minimum requirements for an active mirror have not been met. Placing mirror 50060160c7e05f0d:3a00000000000xxx in the attention state automatically." :: Category=System Component=rmd
"2019-02-06T05:43:40.642Z" "Unity_spb" "Kittyhawk_safe" "17322" "unix/spb/root" "INFO" "1:105020c" :: "Image 50060160c7e068xx of the synchronous mirror with ID 50060160c7e05f0d:3a000000000000xx has been system fractured." :: Category=System Component=rmd
"2019-02-06T05:43:42.361Z" "Unity_spb" "Neo_CEM" "28673" "N/A" "ERROR" "14:6077e" :: "Replication session rep_sess_nas_36_nas_40_APMxxx1_APMxxx0 lost sync communication with its remote session" :: Category=User Component=Health
c4_safe_ktrace.log :
2019/02/06-05:43:23.361373 15K 7F239F8DC7xx std:RMD: Failed CMI transmission. CMI Ack Received Status = 0x7e11f061, mirror 103079215142_APMxxx1_0000_103079215144_APM00
2019/02/06-05:43:23.361375 ~~~~ 7F239F8DC7xx std:RMD: mAbortSync() called 103079215142_APMxxx1_0000_103079215144_APMxxx0_0000[6852]
2019/02/06-05:43:23.361377 ~~~~ 7F239F8DC7xx std:RMD: AbortSync Overlap 0 mirror 103079215142_APMxxx1_0000_103079215144_APMxxx0_0000
2019/02/06-05:43:23.361377 ~~~~ 7F239F8DC7xx std:RMD: mAbortSyncOperation() 103079215142_APMxxx1_0000_103079215144_APMxxx0_0000 [6852] 0/0
2019/02/06-05:43:23.361427 44 7F238C79E7xx std:RMD: Sys. Fracturing an image in syncQueue !!
2019/02/06-05:43:23.361428 ~~~~ 7F239F8DC7xx std:RMD: Released Sync Resource 0x7f199d3194xx for SyncIo 0x7f1a95c79d70 in mirror 103079215142_APMxxx1_0000_103079215144_AP
2019/02/06-05:43:23.361429 ~~~~ 7F238C79E7xx std:RMD: configPerformFracture called from line [2674] for mirror 103079215142_APMxxx1_0000_103079215xxx_APMxxx0_0000
2019/02/06-05:43:23.361781 346 7F2395E7Bxx std:PSMSYS:PSMSYS:psmDataAreaCloseCommit(001:014) DEFERRED for DW...
2019/02/06-05:43:23.361870 83 7F2395E7B7xx std:PSMSYS:PSMSYS:psmDataAreaCloseCommit(001:014) DEFERRED for WIP...
2019/02/06-05:43:23.361871 ~~~~ 7F2395E7B7xx std:PSMSYS:PSMSYS:psmDataAreaClose(1:14): PENDED...
2019/02/06-05:43:23.365851 3974 7F238C79E7xx std:RMD: Mirror 103079215142_APMxxx1_0000_103079215144_APMxxx0_0000 - Fracturing an already fractured slave
2019/02/06-05:43:23.365902 46 7F238C79E7xx std:RMD:mirrorFractureSlave: Aborting any pending Syncs for mirror(103079215142_APMxxx1_0000_103079215144_APMxxx0_000
2019/02/06-05:43:23.365903 ~~~~ 7F238C79E7xx std:RMD: mAbortSync() called 103079215142_APMxxx1_0000_103079215144_APMxxx0_0000[5872]
2019/02/06-05:43:23.365905 ~~~~ 7F238C79E7xx std:RMD: Aborted Pending Sync IO in CMI for mirror 103079215142_APMxxx1_0000_103079215144_APMxxx0_0000
2019/02/06-05:43:23.365906 ~~~~ 7F238C79E7xx std:RMD: Mirror 103079215142_APMxxx1_0000_103079215144_APMxxx0_0000 Image #1 has been fractured; 786432 bits in FL