Dell Unity: Synkronoinnin replikoinnin tila Lost Sync Communication (0x840e)
Summary: Synkronoinnin replikointi onnistui, mutta se menettää synkronoinnin välittömästi. Ongelma voidaan esittää joko SPA: ssa tai SPB: ssä tai molemmissa SP: ssä. (käyttäjän korjattavissa)
Symptoms
FC-kaavamuutos tehtiin SRC SP: n ja DR SP: n välisten ristikkäisten FC-yhteyksien ratkaisemiseksi.
- Synkronoinnin replikointi-istunto luotiin, mutta se menettää synkronoinnin välittömästi.
- Ongelma voi näkyä SPA: ssa tai SPB: ssä tai molemmissa SP: ssä.
- Jos ongelma näkyy vain yhdessä tallennussuorittimessa, istunto voidaan siirtää toiseen SP:hen, jolloin se toimii hyvin.
Cause
- FC-yhteyksien tarkastelun jälkeen havaittiin, että yhteydet ylitettiin ja FC-yhteyden ja kaavoituksen muutos tehtiin uudelleen oikeiden SPA <=> SPA, SPB <= SPB -> yhteyksien sallimiseksi.
- Vaikka FC-yhteydet on korjattu, synkronoinnin replikointi-istunto ilmoittaa synkronointiyhteyden katkeamisesta ilman tallennussuorittimien uudelleenkäynnistystä sekä SRC:ssä että DR:ssä. Mutta yhteenliittäminen osoittaa ok.
Resolution
Kun synkronointireplikointi on suoritettu siellä, missä FC-yhteydet ja vyöhyke on tehty, käynnistä uudelleen sekä SP:t SRC:ssä että DR:ssä.
Ehdotetut muutokset ovat seuraavat: seuraava päivitetään replikoinnin määritystä koskevaan tulevaan dokumentaatioon:
Vyöhykkeiden määrittäminen
Varmista, että teet seuraavat toimet:
- Määrittämällä portin F-portiksi voit välttää mahdolliset ongelmat ja poistamalla muun tyyppiset portit sallittujen porttityyppien luettelosta.
- Jos haluat synkronisen replikointiyhteyden, liitä lähdejärjestelmän SPA-portti kohdejärjestelmän SPA-porttiin. Vastaavasti lähdejärjestelmän SPB-portti kohdejärjestelmän SPB-porttiin
Esimerkki:
- OB_H1450 SPA-portti 4 <--> OB_H1443 SPA-portti 4
- OB_H1450 SPB-portti 4 <--> OB_H1443 SPB-portti 4
Jos kuitukanavamääritys on korjattu virheellisen ristiinmäärityksen vuoksi.
Esimerkiksi kuitukanavakokoonpano on määritetty ristiin virheellisesti:
- OB_H1450 SPA-portti 4 <--> OB_H1443 SPB-portti 4
- OB_H1450 SPB-portti 4 <--> OB_H1443 SPA-portti 4
Kokoonpano on korjattu:
- OB_H1450 SPA-portti 4 <--> OB_H1443 SPA-portti 4
- OB_H1450 SPB-portti 4 <--> OB_H1443 SPB-portti 4
Varmista, että käynnistät uudelleen sekä lähdejärjestelmän että kohdejärjestelmän SP: n.
Samalla puolella (lähteessä tai kohteessa) sijaitsevien SPA- ja SPB-porttien porttikokoonpanon on oltava samat. Lähdejärjestelmän porttien määritys voi kuitenkin poiketa kohdejärjestelmän porttimäärityksestä. Esimerkiksi SPA-porttia 4 <--> SPA I/O Module 0 -porttia 0 ja SPB-porttia 4 <--> SPB I/O Module 0 Port 0 tuetaan.
Additional Information
Esimerkki: Seuraava ongelma havaittiin vain SPB:n NAS-palvelinsyn replikaatiossa, jossa FC-yhteyksien topologia on SRC FC -kytkin, Core FC -kytkin <><> , DR FC -kytkin.
SRC: APMxxx1 DR: APMxxx0 2: ID = RS_5 Name = unitySync Address = x.b.8.115 Alternate Management Address = x.b.8.115 Model = Unity 400 Serial number = APMxxx0 Connection type = sync Source interfaces = x.a.0.80, x.a.0.81 Local interfaces = x.a.0.80, x.a.0.81 Remote interfaces = x.b.8.130, x.b.8.131 Operational status = OK (0x2) Health state = OK (5) Health details = "Communication with the replication host is established. No action is required." Synchronous FC ports = spa_fc4, spb_fc4 | nasServer | x.x.x.2 x.x.x.2 | Not Configured | B | bond10 bond10 | 0x180000001B | 27 | 25 | TRUE | NFS | Name = rep_sess_nas_25_nas_34_APMxxx1_APMxxx0 Session type = nas server Synchronization type = sync RPO = N/A Resource type = NAS Server Sync State = out of sync Health state = Minor failure (15) Health details = "The connection with this remote replication host has been lost. On the Replication Connections page, click the Verify and Update Connection button. Operational status = Lost Sync Communication (0x840e) Source status = OK Destination status = OK Network status = Lost Sync communication Destination type = remote Destination system = RS_5 Local role = Source Source resource = nas_25 Source SP-A interface = x.a.0.80 Source SP-B interface = x.a.0.81 Destination resource = nas_34 Destination SP-A interface = x.b.8.130 Destination SP-B interface = x.b.8.131 Time of last sync = N/A Sync status = Sync transfer rate = N/A Sync transfer size remaining = N/A Previous transfer rate = N/A Average transfer rate = N/A Element pairs = N/A Hourly Snapshot Retention = Daily Snapshot Retention = Hourly snapshot keep for = Hourly snapshot allow auto-delete = Daily snapshot keep for = Daily snapshot allow auto-delete =
EMCSystemLogFile.log:
"2019-02-06T05:43:40.593Z" "Unity_spb" "Kittyhawk_safe" "17322" "unix/spb/root" "INFO" "1:1050207" :: "The minimum requirements for an active mirror have been met. Placing mirror 50060160c7e05f0d:3a000000000000xx in the active state automatically." :: Category=System Component=rmd
"2019-02-06T05:43:40.605Z" "Unity_spb" "Kittyhawk_safe" "17322" "unix/spb/root" "INFO" "1:1050210" :: "Full synchronization has started on image 50060160c7e068xx of the synchronous mirror with ID 50060160c7e05f0d:3a000000000000xx." :: Category=System Component=rmd
"2019-02-06T05:43:40.622Z" "Unity_spb" "Kittyhawk_safe" "17322" "unix/spb/root" "INFO" "1:1050401" :: "K10 50060160c7e068xx became unreachable." :: Category=System Component=rmd
"2019-02-06T05:43:40.633Z" "Unity_spb" "Kittyhawk_safe" "17322" "unix/spb/root" "INFO" "1:1050208" :: "The minimum requirements for an active mirror have not been met. Placing mirror 50060160c7e05f0d:3a00000000000xxx in the attention state automatically." :: Category=System Component=rmd
"2019-02-06T05:43:40.642Z" "Unity_spb" "Kittyhawk_safe" "17322" "unix/spb/root" "INFO" "1:105020c" :: "Image 50060160c7e068xx of the synchronous mirror with ID 50060160c7e05f0d:3a000000000000xx has been system fractured." :: Category=System Component=rmd
"2019-02-06T05:43:42.361Z" "Unity_spb" "Neo_CEM" "28673" "N/A" "ERROR" "14:6077e" :: "Replication session rep_sess_nas_36_nas_40_APMxxx1_APMxxx0 lost sync communication with its remote session" :: Category=User Component=Health
c4_safe_ktrace.log:
2019/02/06-05:43:23.361373 15K 7F239F8DC7xx std:RMD: Failed CMI transmission. CMI Ack Received Status = 0x7e11f061, mirror 103079215142_APMxxx1_0000_103079215144_APM00
2019/02/06-05:43:23.361375 ~~~~ 7F239F8DC7xx std:RMD: mAbortSync() called 103079215142_APMxxx1_0000_103079215144_APMxxx0_0000[6852]
2019/02/06-05:43:23.361377 ~~~~ 7F239F8DC7xx std:RMD: AbortSync Overlap 0 mirror 103079215142_APMxxx1_0000_103079215144_APMxxx0_0000
2019/02/06-05:43:23.361377 ~~~~ 7F239F8DC7xx std:RMD: mAbortSyncOperation() 103079215142_APMxxx1_0000_103079215144_APMxxx0_0000 [6852] 0/0
2019/02/06-05:43:23.361427 44 7F238C79E7xx std:RMD: Sys. Fracturing an image in syncQueue !!
2019/02/06-05:43:23.361428 ~~~~ 7F239F8DC7xx std:RMD: Released Sync Resource 0x7f199d3194xx for SyncIo 0x7f1a95c79d70 in mirror 103079215142_APMxxx1_0000_103079215144_AP
2019/02/06-05:43:23.361429 ~~~~ 7F238C79E7xx std:RMD: configPerformFracture called from line [2674] for mirror 103079215142_APMxxx1_0000_103079215xxx_APMxxx0_0000
2019/02/06-05:43:23.361781 346 7F2395E7Bxx std:PSMSYS:PSMSYS:psmDataAreaCloseCommit(001:014) DEFERRED for DW...
2019/02/06-05:43:23.361870 83 7F2395E7B7xx std:PSMSYS:PSMSYS:psmDataAreaCloseCommit(001:014) DEFERRED for WIP...
2019/02/06-05:43:23.361871 ~~~~ 7F2395E7B7xx std:PSMSYS:PSMSYS:psmDataAreaClose(1:14): PENDED...
2019/02/06-05:43:23.365851 3974 7F238C79E7xx std:RMD: Mirror 103079215142_APMxxx1_0000_103079215144_APMxxx0_0000 - Fracturing an already fractured slave
2019/02/06-05:43:23.365902 46 7F238C79E7xx std:RMD:mirrorFractureSlave: Aborting any pending Syncs for mirror(103079215142_APMxxx1_0000_103079215144_APMxxx0_000
2019/02/06-05:43:23.365903 ~~~~ 7F238C79E7xx std:RMD: mAbortSync() called 103079215142_APMxxx1_0000_103079215144_APMxxx0_0000[5872]
2019/02/06-05:43:23.365905 ~~~~ 7F238C79E7xx std:RMD: Aborted Pending Sync IO in CMI for mirror 103079215142_APMxxx1_0000_103079215144_APMxxx0_0000
2019/02/06-05:43:23.365906 ~~~~ 7F238C79E7xx std:RMD: Mirror 103079215142_APMxxx1_0000_103079215144_APMxxx0_0000 Image #1 has been fractured; 786432 bits in FL