Dell Unity: Status der synchronen Replikation 0x840e Synchronisierungskommunikation unterbrochen
Summary: Die synchrone Replikation wurde erfolgreich erstellt, wird aber sofort wieder unterbrochen. Das Problem kann entweder auf SPA oder SPB oder beiden SPs auftreten. (Vom Nutzer korrigierbar) ...
Symptoms
Das FC-Zoning wurde geändert, um die FC-Kreuzverbindungen von den SRC-SPs zu den DR-SPs zu korrigieren.
- Eine synchrone Replikationssitzung wurde erfolgreich erstellt, aber sofort wird die Synchronisation verloren.
- Das Problem kann auf SPA oder SPB oder auf beiden auftreten.
- Wenn ein Problem nur auf einem SP auftritt, kann die Sitzung auf den anderen SP verschoben werden und es funktioniert einwandfrei.
Cause
- Nach der Überprüfung von FC-Verbindungen wurde festgestellt, dass die Verbindungen gekreuzt wurden, und die Änderung der FC-Verbindung und des Zoning wurde wiederholt, um korrekte SPA <=> SPA, SPB => SPB-Verbindungen <zu ermöglichen.
- Selbst nachdem die FC-Verbindungen repariert wurden, meldet die synchrone Replikationssitzung ohne Neustart der SPs auf SRC und DR weiterhin eine verlorene synchrone Kommunikation. Aber die Verbindung wird als OK angezeigt.
Resolution
Stellen Sie bei der synchronen Replikation, bei der FC-Verbindungen und Zoning durchgeführt wurden, sicher, dass Sie beide SPs auf SRC und DR neu starten.
Zu Ihrer Information: Die vorgeschlagenen Änderungen lauten wie folgt: Folgendes wird in der zukünftigen Dokumentation für "Konfigurieren der Replikation" aktualisiert:
Zoning-Konfiguration
Stellen Sie sicher, dass Sie Folgendes abschließen:
- Konfigurieren Sie den Port als F-Port, um potenzielle Probleme zu vermeiden, und entfernen Sie andere Porttypen aus der Liste der zulässigen Porttypen.
- Verbinden Sie für eine synchrone Replikationsverbindung den SPA-Port des Quellsystems mit dem SPA-Port des Zielsystems. Analog verhält es sich mit dem SPB-Port des Quellsystems zum SPB-Port des Zielsystems.
Zum Beispiel:
- OB_H1450 SPA-Port 4 <–> OB_H1443 SPA-Port 4
- OB_H1450 SPB-Port 4 <–> OB_H1443 SPB-Port 4
Wenn die Fibre-Channel-Konfiguration von einer falschen Cross-Konfiguration korrigiert wird.
Beispiel: Die Fibre-Channel-Konfiguration wurde falsch übergreifend konfiguriert:
- OB_H1450 SPA-Port 4 <–> OB_H1443 SPB-Port 4
- OB_H1450 SPB-Port 4 <–> OB_H1443 SPA-Port 4
Nun ist die Konfiguration korrigiert:
- OB_H1450 SPA-Port 4 <–> OB_H1443 SPA-Port 4
- OB_H1450 SPB-Port 4 <–> OB_H1443 SPB-Port 4
Stellen Sie sicher, dass Sie beide SPs des Quellsystems und des Zielsystems neu starten.
Die SPA- und SPB-Ports auf derselben Seite (Quelle oder Ziel) müssen die identische Portkonfiguration aufweisen. Die Portkonfiguration auf dem Quellsystem kann sich jedoch von der Portkonfiguration auf dem Zielsystem unterscheiden. Beispielsweise wird SPA Port 4 <--> SPA I/O Module 0 Port 0 and SPB Port 4 <--> SPB I/O Module 0 Port 0 unterstützt.
Additional Information
Beispiel: Das folgende Problem trat nur bei einer synchronen Replikation des NAS-Servers auf dem SPB mit der FC-Verbindungstopologie SRC-FC-Switch <> Core-FC-Switch <> DR-FC-Switch auf.
SRC: APMxxx1 DR: APMxxx0 2: ID = RS_5 Name = unitySync Address = x.b.8.115 Alternate Management Address = x.b.8.115 Model = Unity 400 Serial number = APMxxx0 Connection type = sync Source interfaces = x.a.0.80, x.a.0.81 Local interfaces = x.a.0.80, x.a.0.81 Remote interfaces = x.b.8.130, x.b.8.131 Operational status = OK (0x2) Health state = OK (5) Health details = "Communication with the replication host is established. No action is required." Synchronous FC ports = spa_fc4, spb_fc4 | nasServer | x.x.x.2 x.x.x.2 | Not Configured | B | bond10 bond10 | 0x180000001B | 27 | 25 | TRUE | NFS | Name = rep_sess_nas_25_nas_34_APMxxx1_APMxxx0 Session type = nas server Synchronization type = sync RPO = N/A Resource type = NAS Server Sync State = out of sync Health state = Minor failure (15) Health details = "The connection with this remote replication host has been lost. On the Replication Connections page, click the Verify and Update Connection button. Operational status = Lost Sync Communication (0x840e) Source status = OK Destination status = OK Network status = Lost Sync communication Destination type = remote Destination system = RS_5 Local role = Source Source resource = nas_25 Source SP-A interface = x.a.0.80 Source SP-B interface = x.a.0.81 Destination resource = nas_34 Destination SP-A interface = x.b.8.130 Destination SP-B interface = x.b.8.131 Time of last sync = N/A Sync status = Sync transfer rate = N/A Sync transfer size remaining = N/A Previous transfer rate = N/A Average transfer rate = N/A Element pairs = N/A Hourly Snapshot Retention = Daily Snapshot Retention = Hourly snapshot keep for = Hourly snapshot allow auto-delete = Daily snapshot keep for = Daily snapshot allow auto-delete =
EMCSystemLogFile.log:
"2019-02-06T05:43:40.593Z" "Unity_spb" "Kittyhawk_safe" "17322" "unix/spb/root" "INFO" "1:1050207" :: "The minimum requirements for an active mirror have been met. Placing mirror 50060160c7e05f0d:3a000000000000xx in the active state automatically." :: Category=System Component=rmd
"2019-02-06T05:43:40.605Z" "Unity_spb" "Kittyhawk_safe" "17322" "unix/spb/root" "INFO" "1:1050210" :: "Full synchronization has started on image 50060160c7e068xx of the synchronous mirror with ID 50060160c7e05f0d:3a000000000000xx." :: Category=System Component=rmd
"2019-02-06T05:43:40.622Z" "Unity_spb" "Kittyhawk_safe" "17322" "unix/spb/root" "INFO" "1:1050401" :: "K10 50060160c7e068xx became unreachable." :: Category=System Component=rmd
"2019-02-06T05:43:40.633Z" "Unity_spb" "Kittyhawk_safe" "17322" "unix/spb/root" "INFO" "1:1050208" :: "The minimum requirements for an active mirror have not been met. Placing mirror 50060160c7e05f0d:3a00000000000xxx in the attention state automatically." :: Category=System Component=rmd
"2019-02-06T05:43:40.642Z" "Unity_spb" "Kittyhawk_safe" "17322" "unix/spb/root" "INFO" "1:105020c" :: "Image 50060160c7e068xx of the synchronous mirror with ID 50060160c7e05f0d:3a000000000000xx has been system fractured." :: Category=System Component=rmd
"2019-02-06T05:43:42.361Z" "Unity_spb" "Neo_CEM" "28673" "N/A" "ERROR" "14:6077e" :: "Replication session rep_sess_nas_36_nas_40_APMxxx1_APMxxx0 lost sync communication with its remote session" :: Category=User Component=Health
c4_safe_ktrace.log:
2019/02/06-05:43:23.361373 15K 7F239F8DC7xx std:RMD: Failed CMI transmission. CMI Ack Received Status = 0x7e11f061, mirror 103079215142_APMxxx1_0000_103079215144_APM00
2019/02/06-05:43:23.361375 ~~~~ 7F239F8DC7xx std:RMD: mAbortSync() called 103079215142_APMxxx1_0000_103079215144_APMxxx0_0000[6852]
2019/02/06-05:43:23.361377 ~~~~ 7F239F8DC7xx std:RMD: AbortSync Overlap 0 mirror 103079215142_APMxxx1_0000_103079215144_APMxxx0_0000
2019/02/06-05:43:23.361377 ~~~~ 7F239F8DC7xx std:RMD: mAbortSyncOperation() 103079215142_APMxxx1_0000_103079215144_APMxxx0_0000 [6852] 0/0
2019/02/06-05:43:23.361427 44 7F238C79E7xx std:RMD: Sys. Fracturing an image in syncQueue !!
2019/02/06-05:43:23.361428 ~~~~ 7F239F8DC7xx std:RMD: Released Sync Resource 0x7f199d3194xx for SyncIo 0x7f1a95c79d70 in mirror 103079215142_APMxxx1_0000_103079215144_AP
2019/02/06-05:43:23.361429 ~~~~ 7F238C79E7xx std:RMD: configPerformFracture called from line [2674] for mirror 103079215142_APMxxx1_0000_103079215xxx_APMxxx0_0000
2019/02/06-05:43:23.361781 346 7F2395E7Bxx std:PSMSYS:PSMSYS:psmDataAreaCloseCommit(001:014) DEFERRED for DW...
2019/02/06-05:43:23.361870 83 7F2395E7B7xx std:PSMSYS:PSMSYS:psmDataAreaCloseCommit(001:014) DEFERRED for WIP...
2019/02/06-05:43:23.361871 ~~~~ 7F2395E7B7xx std:PSMSYS:PSMSYS:psmDataAreaClose(1:14): PENDED...
2019/02/06-05:43:23.365851 3974 7F238C79E7xx std:RMD: Mirror 103079215142_APMxxx1_0000_103079215144_APMxxx0_0000 - Fracturing an already fractured slave
2019/02/06-05:43:23.365902 46 7F238C79E7xx std:RMD:mirrorFractureSlave: Aborting any pending Syncs for mirror(103079215142_APMxxx1_0000_103079215144_APMxxx0_000
2019/02/06-05:43:23.365903 ~~~~ 7F238C79E7xx std:RMD: mAbortSync() called 103079215142_APMxxx1_0000_103079215144_APMxxx0_0000[5872]
2019/02/06-05:43:23.365905 ~~~~ 7F238C79E7xx std:RMD: Aborted Pending Sync IO in CMI for mirror 103079215142_APMxxx1_0000_103079215144_APMxxx0_0000
2019/02/06-05:43:23.365906 ~~~~ 7F238C79E7xx std:RMD: Mirror 103079215142_APMxxx1_0000_103079215144_APMxxx0_0000 Image #1 has been fractured; 786432 bits in FL