Dell Unity: Stato replica sincronizzazione Comunicazione sincronizzazione persa (0x840e)
Summary: La replica di sincronizzazione è stata creata correttamente, ma perde immediatamente la sincronizzazione. Il problema potrebbe essere presentato su SPA o SPB o su entrambi gli SP. (correggibile dall'utente) (in inglese) ...
Symptoms
È stata apportata una modifica alla zonatura FC per risolvere le connessioni FC incrociate dagli SP SRC agli SP DR.
- Una sessione di replica di sincronizzazione è stata creata correttamente, ma perde immediatamente la sincronizzazione.
- Il problema potrebbe essere riscontrato sull'SPA o sull'SPB o su entrambi gli SP.
- Quando si verifica un problema su un solo SP, la sessione potrebbe essere spostata sull'altro SP e funziona correttamente.
Cause
- Dopo aver esaminato le connessioni FC, è stato rilevato che le connessioni sono state incrociate ed è stata ripetuta la modifica della connessione FC e della suddivisione in zone per consentire la correzione SPA <=> SPA, SPB <=> connessioni SPB.
- Anche dopo che le connessioni FC sono state corrette, senza riavviare gli SP su SRC e DR, la sessione di replica di sincronizzazione continua a segnalare la perdita della comunicazione di sincronizzazione. Ma l'interconnessione mostra ok.
Resolution
Con la replica sincronizzata in cui sono state eseguite le connessioni FC e la suddivisione in zone, assicurarsi di riavviare entrambi gli SP su SRC e DR.
Per riferimento, le modifiche proposte sono le seguenti; quanto segue è aggiornato nella documentazione futura per "Configuring Replication":
Configurazione
della suddivisione in zone Accertarsi di completare quanto segue:
- Configurare la porta come F-port per evitare potenziali problemi e rimuovere altri tipi di porte dall'elenco dei tipi di porta consentiti.
- Per una connessione di replica sincrona, connettere la porta SPA del sistema di origine alla porta SPA del sistema di destinazione. Analogamente, dalla porta SPB del sistema di origine alla porta SPB del sistema di destinazione
Esempio:
- OB_H1450 SPA Porta 4 <--> OB_H1443 Porta SPA 4
- OB_H1450 porta SPB 4 <--> OB_H1443 porta SPB 4
Se la configurazione Fibre Channel viene corretta da una configurazione incrociata errata.
Ad esempio, la configurazione incrociata di Fibre Channel è stata configurata in modo errato:
- Porta SPA OB_H1450 4 <--> Porta SPB OB_H1443 4
- Porta SPB OB_H1450 4 <--> Porta SPA OB_H1443 4
A questo punto, la configurazione è corretta:
- OB_H1450 SPA Porta 4 <--> OB_H1443 Porta SPA 4
- OB_H1450 porta SPB 4 <--> OB_H1443 porta SPB 4
Accertarsi di riavviare entrambi gli SP del sistema di origine e del sistema di destinazione.
Le porte SPA e SPB sullo stesso lato (origine o destinazione) devono avere la stessa configurazione di porte. Tuttavia, la configurazione delle porte sul sistema di origine può differire dalla configurazione delle porte sul sistema di destinazione. Ad esempio, SPA Port 4 <--> SPA I/O Module 0 Port 0 e SPB Port 4 <-- SPB I/O Module 0 Port 0 sono> supportati.
Additional Information
Esempio: Il seguente problema è stato riscontrato solo su una replica sincrona del server NAS su SPB in cui la topologia delle connessioni FC è lo switch FC SRC, lo switch <> FC Core, lo switch <> FC DR.
SRC: APMxxx1 DR: APMxxx0 2: ID = RS_5 Name = unitySync Address = x.b.8.115 Alternate Management Address = x.b.8.115 Model = Unity 400 Serial number = APMxxx0 Connection type = sync Source interfaces = x.a.0.80, x.a.0.81 Local interfaces = x.a.0.80, x.a.0.81 Remote interfaces = x.b.8.130, x.b.8.131 Operational status = OK (0x2) Health state = OK (5) Health details = "Communication with the replication host is established. No action is required." Synchronous FC ports = spa_fc4, spb_fc4 | nasServer | x.x.x.2 x.x.x.2 | Not Configured | B | bond10 bond10 | 0x180000001B | 27 | 25 | TRUE | NFS | Name = rep_sess_nas_25_nas_34_APMxxx1_APMxxx0 Session type = nas server Synchronization type = sync RPO = N/A Resource type = NAS Server Sync State = out of sync Health state = Minor failure (15) Health details = "The connection with this remote replication host has been lost. On the Replication Connections page, click the Verify and Update Connection button. Operational status = Lost Sync Communication (0x840e) Source status = OK Destination status = OK Network status = Lost Sync communication Destination type = remote Destination system = RS_5 Local role = Source Source resource = nas_25 Source SP-A interface = x.a.0.80 Source SP-B interface = x.a.0.81 Destination resource = nas_34 Destination SP-A interface = x.b.8.130 Destination SP-B interface = x.b.8.131 Time of last sync = N/A Sync status = Sync transfer rate = N/A Sync transfer size remaining = N/A Previous transfer rate = N/A Average transfer rate = N/A Element pairs = N/A Hourly Snapshot Retention = Daily Snapshot Retention = Hourly snapshot keep for = Hourly snapshot allow auto-delete = Daily snapshot keep for = Daily snapshot allow auto-delete =
EMCSystemLogFile.log:
"2019-02-06T05:43:40.593Z" "Unity_spb" "Kittyhawk_safe" "17322" "unix/spb/root" "INFO" "1:1050207" :: "The minimum requirements for an active mirror have been met. Placing mirror 50060160c7e05f0d:3a000000000000xx in the active state automatically." :: Category=System Component=rmd
"2019-02-06T05:43:40.605Z" "Unity_spb" "Kittyhawk_safe" "17322" "unix/spb/root" "INFO" "1:1050210" :: "Full synchronization has started on image 50060160c7e068xx of the synchronous mirror with ID 50060160c7e05f0d:3a000000000000xx." :: Category=System Component=rmd
"2019-02-06T05:43:40.622Z" "Unity_spb" "Kittyhawk_safe" "17322" "unix/spb/root" "INFO" "1:1050401" :: "K10 50060160c7e068xx became unreachable." :: Category=System Component=rmd
"2019-02-06T05:43:40.633Z" "Unity_spb" "Kittyhawk_safe" "17322" "unix/spb/root" "INFO" "1:1050208" :: "The minimum requirements for an active mirror have not been met. Placing mirror 50060160c7e05f0d:3a00000000000xxx in the attention state automatically." :: Category=System Component=rmd
"2019-02-06T05:43:40.642Z" "Unity_spb" "Kittyhawk_safe" "17322" "unix/spb/root" "INFO" "1:105020c" :: "Image 50060160c7e068xx of the synchronous mirror with ID 50060160c7e05f0d:3a000000000000xx has been system fractured." :: Category=System Component=rmd
"2019-02-06T05:43:42.361Z" "Unity_spb" "Neo_CEM" "28673" "N/A" "ERROR" "14:6077e" :: "Replication session rep_sess_nas_36_nas_40_APMxxx1_APMxxx0 lost sync communication with its remote session" :: Category=User Component=Health
c4_safe_ktrace.log:
2019/02/06-05:43:23.361373 15K 7F239F8DC7xx std:RMD: Failed CMI transmission. CMI Ack Received Status = 0x7e11f061, mirror 103079215142_APMxxx1_0000_103079215144_APM00
2019/02/06-05:43:23.361375 ~~~~ 7F239F8DC7xx std:RMD: mAbortSync() called 103079215142_APMxxx1_0000_103079215144_APMxxx0_0000[6852]
2019/02/06-05:43:23.361377 ~~~~ 7F239F8DC7xx std:RMD: AbortSync Overlap 0 mirror 103079215142_APMxxx1_0000_103079215144_APMxxx0_0000
2019/02/06-05:43:23.361377 ~~~~ 7F239F8DC7xx std:RMD: mAbortSyncOperation() 103079215142_APMxxx1_0000_103079215144_APMxxx0_0000 [6852] 0/0
2019/02/06-05:43:23.361427 44 7F238C79E7xx std:RMD: Sys. Fracturing an image in syncQueue !!
2019/02/06-05:43:23.361428 ~~~~ 7F239F8DC7xx std:RMD: Released Sync Resource 0x7f199d3194xx for SyncIo 0x7f1a95c79d70 in mirror 103079215142_APMxxx1_0000_103079215144_AP
2019/02/06-05:43:23.361429 ~~~~ 7F238C79E7xx std:RMD: configPerformFracture called from line [2674] for mirror 103079215142_APMxxx1_0000_103079215xxx_APMxxx0_0000
2019/02/06-05:43:23.361781 346 7F2395E7Bxx std:PSMSYS:PSMSYS:psmDataAreaCloseCommit(001:014) DEFERRED for DW...
2019/02/06-05:43:23.361870 83 7F2395E7B7xx std:PSMSYS:PSMSYS:psmDataAreaCloseCommit(001:014) DEFERRED for WIP...
2019/02/06-05:43:23.361871 ~~~~ 7F2395E7B7xx std:PSMSYS:PSMSYS:psmDataAreaClose(1:14): PENDED...
2019/02/06-05:43:23.365851 3974 7F238C79E7xx std:RMD: Mirror 103079215142_APMxxx1_0000_103079215144_APMxxx0_0000 - Fracturing an already fractured slave
2019/02/06-05:43:23.365902 46 7F238C79E7xx std:RMD:mirrorFractureSlave: Aborting any pending Syncs for mirror(103079215142_APMxxx1_0000_103079215144_APMxxx0_000
2019/02/06-05:43:23.365903 ~~~~ 7F238C79E7xx std:RMD: mAbortSync() called 103079215142_APMxxx1_0000_103079215144_APMxxx0_0000[5872]
2019/02/06-05:43:23.365905 ~~~~ 7F238C79E7xx std:RMD: Aborted Pending Sync IO in CMI for mirror 103079215142_APMxxx1_0000_103079215144_APMxxx0_0000
2019/02/06-05:43:23.365906 ~~~~ 7F238C79E7xx std:RMD: Mirror 103079215142_APMxxx1_0000_103079215144_APMxxx0_0000 Image #1 has been fractured; 786432 bits in FL