Dell Unity: Estado de replicación síncrona Se perdió la comunicación síncrona (0x840e)
Summary: La replicación síncrona se creó correctamente, pero inmediatamente pierde la sincronización. El problema podría presentarse en SPA, SPB o ambos SP. (Corregible por el usuario)
Symptoms
El cambio de zonificación de FC se realizó para resolver las conexiones de FC cruzadas de los SP de SRC a los SP de DR.
- Una sesión de replicación síncrona se creó correctamente, pero inmediatamente pierde la sincronización.
- El problema se puede observar en SPA, SPB o ambos SP.
- Cuando se observa un problema en un solo SP, la sesión se puede transferir al otro SP y funciona correctamente.
Cause
- Después de revisar las conexiones FC, se descubrió que las conexiones se cruzaron y la modificación de la conexión FC y la zonificación se rerealizó para permitir las conexiones correctas SPA <=> SPA, SPB <=> SPB.
- Incluso después de que se repararon las conexiones FC, sin reiniciar los SP en SRC y DR, la sesión de replicación síncrona aún informa la pérdida de comunicación síncrona. Pero la interconexión muestra que está bien.
Resolution
Con la replicación sincronizada en la que se realizaron conexiones FC y zonificación, asegúrese de reiniciar ambos SP en SRC y DR.
A modo de referencia, los cambios propuestos son los siguientes. Lo siguiente se actualizará en la documentación futura para "Configuración de la replicación":
Configuración de zonificación Asegúrese de
completar lo siguiente:
- Configure el puerto como un puerto F para evitar posibles problemas y elimine otros tipos de puertos de la lista de tipos de puertos permitidos.
- Para una conexión de replicación síncrona, conecte el puerto del SPA del sistema de origen al puerto del SPA del sistema de destino. De manera similar, el puerto SPB del sistema de origen al puerto SPB del sistema de destino
Por ejemplo:
- Puerto 4 del SPA OB_H1450 <:> puerto 4 del SPA OB_H1443
- Puerto <4 del SPB de OB_H1450:> OB_H1443 puerto 4 del SPB
Si la configuración de Fibre Channel se corrige a partir de una configuración cruzada incorrecta.
Por ejemplo, la configuración de Fibre Channel se realizó de manera incorrecta:
- Puerto 4 del SPA <de OB_H1450:> puerto 4 del SPB OB_H1443
- Puerto 4 del SPB de <OB_H1450:> puerto 4 del SPA OB_H1443
Ahora, se corrigió la configuración:
- Puerto 4 del SPA OB_H1450 <:> puerto 4 del SPA OB_H1443
- Puerto <4 del SPB de OB_H1450:> OB_H1443 puerto 4 del SPB
Asegúrese de reiniciar ambos SP del sistema de origen y del sistema de destino.
Los puertos SPA y SPB en el mismo lado (origen o destino) deben tener la misma configuración de puertos. Sin embargo, la configuración de puertos en el sistema de origen puede ser diferente de la configuración de puertos en el sistema de destino. Por ejemplo, se admiten el puerto del SPA 4 <--> puerto 0 del módulo de I/O 0 del SPA y el puerto del SPB 4 <--> puerto 0 del módulo de I/O del SPB 0.
Additional Information
Ejemplo: El siguiente problema se observó solo en una replicación syn de servidor NAS en SPB donde la topología de conexiones FC es SRC FC <> switch Core FC <> switch DR FC.
SRC: APMxxx1 DR: APMxxx0 2: ID = RS_5 Name = unitySync Address = x.b.8.115 Alternate Management Address = x.b.8.115 Model = Unity 400 Serial number = APMxxx0 Connection type = sync Source interfaces = x.a.0.80, x.a.0.81 Local interfaces = x.a.0.80, x.a.0.81 Remote interfaces = x.b.8.130, x.b.8.131 Operational status = OK (0x2) Health state = OK (5) Health details = "Communication with the replication host is established. No action is required." Synchronous FC ports = spa_fc4, spb_fc4 | nasServer | x.x.x.2 x.x.x.2 | Not Configured | B | bond10 bond10 | 0x180000001B | 27 | 25 | TRUE | NFS | Name = rep_sess_nas_25_nas_34_APMxxx1_APMxxx0 Session type = nas server Synchronization type = sync RPO = N/A Resource type = NAS Server Sync State = out of sync Health state = Minor failure (15) Health details = "The connection with this remote replication host has been lost. On the Replication Connections page, click the Verify and Update Connection button. Operational status = Lost Sync Communication (0x840e) Source status = OK Destination status = OK Network status = Lost Sync communication Destination type = remote Destination system = RS_5 Local role = Source Source resource = nas_25 Source SP-A interface = x.a.0.80 Source SP-B interface = x.a.0.81 Destination resource = nas_34 Destination SP-A interface = x.b.8.130 Destination SP-B interface = x.b.8.131 Time of last sync = N/A Sync status = Sync transfer rate = N/A Sync transfer size remaining = N/A Previous transfer rate = N/A Average transfer rate = N/A Element pairs = N/A Hourly Snapshot Retention = Daily Snapshot Retention = Hourly snapshot keep for = Hourly snapshot allow auto-delete = Daily snapshot keep for = Daily snapshot allow auto-delete =
EMCSystemLogFile.log:
"2019-02-06T05:43:40.593Z" "Unity_spb" "Kittyhawk_safe" "17322" "unix/spb/root" "INFO" "1:1050207" :: "The minimum requirements for an active mirror have been met. Placing mirror 50060160c7e05f0d:3a000000000000xx in the active state automatically." :: Category=System Component=rmd
"2019-02-06T05:43:40.605Z" "Unity_spb" "Kittyhawk_safe" "17322" "unix/spb/root" "INFO" "1:1050210" :: "Full synchronization has started on image 50060160c7e068xx of the synchronous mirror with ID 50060160c7e05f0d:3a000000000000xx." :: Category=System Component=rmd
"2019-02-06T05:43:40.622Z" "Unity_spb" "Kittyhawk_safe" "17322" "unix/spb/root" "INFO" "1:1050401" :: "K10 50060160c7e068xx became unreachable." :: Category=System Component=rmd
"2019-02-06T05:43:40.633Z" "Unity_spb" "Kittyhawk_safe" "17322" "unix/spb/root" "INFO" "1:1050208" :: "The minimum requirements for an active mirror have not been met. Placing mirror 50060160c7e05f0d:3a00000000000xxx in the attention state automatically." :: Category=System Component=rmd
"2019-02-06T05:43:40.642Z" "Unity_spb" "Kittyhawk_safe" "17322" "unix/spb/root" "INFO" "1:105020c" :: "Image 50060160c7e068xx of the synchronous mirror with ID 50060160c7e05f0d:3a000000000000xx has been system fractured." :: Category=System Component=rmd
"2019-02-06T05:43:42.361Z" "Unity_spb" "Neo_CEM" "28673" "N/A" "ERROR" "14:6077e" :: "Replication session rep_sess_nas_36_nas_40_APMxxx1_APMxxx0 lost sync communication with its remote session" :: Category=User Component=Health
c4_safe_ktrace.log:
2019/02/06-05:43:23.361373 15K 7F239F8DC7xx std:RMD: Failed CMI transmission. CMI Ack Received Status = 0x7e11f061, mirror 103079215142_APMxxx1_0000_103079215144_APM00
2019/02/06-05:43:23.361375 ~~~~ 7F239F8DC7xx std:RMD: mAbortSync() called 103079215142_APMxxx1_0000_103079215144_APMxxx0_0000[6852]
2019/02/06-05:43:23.361377 ~~~~ 7F239F8DC7xx std:RMD: AbortSync Overlap 0 mirror 103079215142_APMxxx1_0000_103079215144_APMxxx0_0000
2019/02/06-05:43:23.361377 ~~~~ 7F239F8DC7xx std:RMD: mAbortSyncOperation() 103079215142_APMxxx1_0000_103079215144_APMxxx0_0000 [6852] 0/0
2019/02/06-05:43:23.361427 44 7F238C79E7xx std:RMD: Sys. Fracturing an image in syncQueue !!
2019/02/06-05:43:23.361428 ~~~~ 7F239F8DC7xx std:RMD: Released Sync Resource 0x7f199d3194xx for SyncIo 0x7f1a95c79d70 in mirror 103079215142_APMxxx1_0000_103079215144_AP
2019/02/06-05:43:23.361429 ~~~~ 7F238C79E7xx std:RMD: configPerformFracture called from line [2674] for mirror 103079215142_APMxxx1_0000_103079215xxx_APMxxx0_0000
2019/02/06-05:43:23.361781 346 7F2395E7Bxx std:PSMSYS:PSMSYS:psmDataAreaCloseCommit(001:014) DEFERRED for DW...
2019/02/06-05:43:23.361870 83 7F2395E7B7xx std:PSMSYS:PSMSYS:psmDataAreaCloseCommit(001:014) DEFERRED for WIP...
2019/02/06-05:43:23.361871 ~~~~ 7F2395E7B7xx std:PSMSYS:PSMSYS:psmDataAreaClose(1:14): PENDED...
2019/02/06-05:43:23.365851 3974 7F238C79E7xx std:RMD: Mirror 103079215142_APMxxx1_0000_103079215144_APMxxx0_0000 - Fracturing an already fractured slave
2019/02/06-05:43:23.365902 46 7F238C79E7xx std:RMD:mirrorFractureSlave: Aborting any pending Syncs for mirror(103079215142_APMxxx1_0000_103079215144_APMxxx0_000
2019/02/06-05:43:23.365903 ~~~~ 7F238C79E7xx std:RMD: mAbortSync() called 103079215142_APMxxx1_0000_103079215144_APMxxx0_0000[5872]
2019/02/06-05:43:23.365905 ~~~~ 7F238C79E7xx std:RMD: Aborted Pending Sync IO in CMI for mirror 103079215142_APMxxx1_0000_103079215144_APMxxx0_0000
2019/02/06-05:43:23.365906 ~~~~ 7F238C79E7xx std:RMD: Mirror 103079215142_APMxxx1_0000_103079215144_APMxxx0_0000 Image #1 has been fractured; 786432 bits in FL