PowerFlexin replikointi – ensimmäinen kopiointivirhe

Summary: Alkuperäisen kopioinnin edistyminen on jumissa. Joskus se saattaa onnistua saavuttamaan 100%: n valmistumisen pienille taltioille, kun taas suuret määrät eivät saaneet alkuperäistä kopiota valmiiksi. ...

This article applies to This article does not apply to This article is not tied to any specific product. Not all product versions are identified in this article.

Symptoms

Tilanne

Jos lähde- ja kohdejärjestelmien välillä on verkko-ongelmia tai kaistanleveys on pieni, ensimmäinen kopiointivaihe ei ehkä koskaan pääty loppuun.

Mahdollinen skenaario on, että ensimmäinen kopio valmistuu pienikokoisille asemille, mutta suuria määriä sisältävissä replikoinnin yhtenäisyysryhmissä (RCG) lähde- ja kohdemäärät eivät pysty saavuttamaan 100 %:n yhdenmukaisuutta ja lähdepäiväkirjan kapasiteetin käyttöaste kasvaa, kun lähdemäärä vastaanottaa uusia kirjoituksia.

Huomautus: Vaikka suuri lähdetaltio pystyisi viimeistelemään alkuperäisen kopion tai jos offline-alkukopiointi tehtäisiin, jos verkko-ongelmia esiintyy ja lähdetaltiolle kirjoitetaan/kirjoitetaan uudelleen, emme ehkä täytä RPO:ta ja menetämme johdonmukaisuuden lähteen ja kohteen välillä. 

Oireet

  1. Alkuperäinen kopiointi keskeytyy, esimerkiksi "Ensimmäisen kopioinnin edistyminen" näyttää pysyvästi 70 %: 

 # scli --query_all_replication_pairs
Local Id: bf50999700000000 Remote Id: bad02d5600000000 Copy Type: ONLINE_COPY Initial Copy State: ACTIVE Name: Rep
Local Volume Id: 2236ff5400000001 Remote Volume Id: 831e94c40000000d Local Volume Name: vol_lir1 Remote Volume Name: vol_lir1
Initial Copy progress: 70%
query_all_replication_pairs returned 1 Replication Pairs.

2 – SDR-jäljityksen tarkistaminen, seuraavat virheet tunnistetaan: Verkko-ongelmat

 27/02 13:39:11.051442 (nil):netCon_ExchangeNewCon_CK:03589: ERROR: Con 0x7f42a80fc5c8 sock 0x7f42a80fd148, Can't send NEW_CON message
27/02 13:39:11.051454 (nil):netCon_ConnectToPeer_CK:03519: Con 0x7f42a80fc5c8 sock 0x7f42a80fd148 rollback connect
27/02 13:39:11.092475 (nil):netCon_IsKaNeeded:04338: ERROR: CON 0x7f42a80fb660 failed to send for 180 iterations. Marking as down
.
.
.
27/02 13:39:12.628337 (nil):mapVolIO_ReportIOErrorIfNeeded:00469: Vol ID 0x21c5f4c600000032. Last vol network error status NOT_CONN(4) Reason (NOT_CONN) RC (NOT_CONN) Retry count (0) chan (0) Total IO millis (1010)
27/02 13:39:12.637268 (nil):mapVolIO_Do_CK:00884: Mit: 0x7f40d59b17d8. Vol ID 0x21c5f4c600000032. Send error. rc NOT_CONN(4)
27/02 13:39:12.637288 (nil):mapVolIO_Do_CK:00884: Mit: 0x7f40d5a46030. Vol ID 0x21c5f4c600000032. Send error. rc NOT_CONN(4)

Alkuperäinen kopiointitila, jossa pienet taltiot kelpaavat mutta suuremmat eivät onnistu viimeistelemään kerran.

 27/02 13:39:10.774502 0x7f42814f9db0:initialCopier_SendSingleVaeDoneMsg:01871: (SDR_INITIAL_COPIER) Initial Copier - Got 2 SYSTEM_INITIAL_COPY CGs and 1 done VAEs
27/02 13:39:10.774520 0x7f42814f9db0:initialCopierCg_FillCgVaeDoneMsg:01963: (SDR_INITIAL_COPIER) Filled VAE Done MSG for Pair-Id de9ddcc900000001, GenNum: 2137, VaeId: 14
27/02 13:39:10.774633 0x7f42814f9db0:initialCopier_SendSingleVaeDoneMsg:01921: (SDR_INITIAL_COPIER) Initial Copier - Total number of 1 VAEs will be reported as Done

3 – Kun tarkistat SDR-yhteyden, saatat huomata, että osa SDR–SDR-yhteyksistä on katkennut.

 scli --query_disconnection --print_all
peer_system ID: ff74bce300000000 Name: DR_PFlex_GW
SDR-SDR connectivity status: Multiple disconnections
SDR ID: 2d01669c00000000 Name: Sdr-172.24.194.137 is disconnected from:
	SDR ID: 67b9def800000000 Name: N/A IPs: 172.24.105.4 172.24.105.2 172.24.100.2	SDR ID: 67ba060800000001 Name: N/A IPs: 172.24.105.6 172.24.105.4 172.24.100.4	SDR ID: 67ba060900000002 Name: N/A IPs: 172.24.105.5	SDR ID: 67ba2d1800000003 Name: N/A IPs: 172.24.135.7 172.24.100.7
SDR ID: 2d01669d00000001 Name: Sdr-172.24.194.138 is disconnected from:
	SDR ID: 67ba060800000001 Name: N/A IPs: 172.24.105.6 172.24.105.4 172.24.100.4	SDR ID: 67b9def800000000 Name: N/A IPs: 172.24.105.4 172.24.105.2 172.24.100.2	SDR ID: 67ba060900000002 Name: N/A IPs: 172.24.105.5	SDR ID: 67ba2d1800000003 Name: N/A IPs: 172.24.135.7 172.24.100.7
SDR ID: 2d01669e00000002 Name: Sdr-172.24.194.135 is disconnected from:
	SDR ID: 67b9def800000000 Name: N/A IPs: 172.24.105.4 172.24.105.2 172.24.100.2	SDR ID: 67ba060800000001 Name: N/A IPs: 172.24.105.6 172.24.105.4 172.24.100.4	SDR ID: 67ba060900000002 Name: N/A IPs: 172.24.105.5	SDR ID: 67ba2d1800000003 Name: N/A IPs: 172.24.135.7 172.24.100.7
SDR ID: 2d01669f00000003 Name: Sdr-172.24.194.136 is disconnected from:
	SDR ID: 67b9def800000000 Name: N/A IPs: 172.24.105.4 172.24.105.2 172.24.100.2	SDR ID: 67ba060800000001 Name: N/A IPs: 172.24.105.6 172.24.105.4 172.24.100.4	SDR ID: 67ba060900000002 Name: N/A IPs: 172.24.105.5	SDR ID: 67ba2d1800000003 Name: N/A IPs: 172.24.135.7 172.24.100.7

 

4 – Vaikka kaikki SDR–SDR-yhteydet toimivat hyvin, mahdollinen tila, jossa esiintyy samoja alkuperäisen kopiointivirheen oireita, voi ilmetä, jos verkon kapasiteetti on heikko eikä kaistanleveys riitä ensimmäisen kopioinnin suorittamiseen loppuun.

Voit testata kaistanleveyttä näiden kahden sivuston välillä käyttämällä erilaisia työkaluja - esimerkiksi "iperf":

Mikä tahansa kaistanleveyden testaus voi vaikuttaa sivustojen väliseen verkkoon - jos Site2Site-replikointiin käytetään WAN-verkkoa, kerro asiakkaalle, että tämä testi on suoritettava alhaisena työaikana ja ottaen huomioon, että verkko, jolle testi suoritetaan, ei ole käytettävissä testin aikana. 

Varmista, että suoritat testin riittävän kauan, jotta saat oikeat lukemat - kuten suurten määrien siirtäminen - Huomaa myös, että tämä testi rasittaa asiakkaiden verkkoa.

 Sivusto1

 [root@112AX-7 ~]# iperf3 -s
-----------------------------------------------------------
Server listening on 5201
-----------------------------------------------------------
Accepted connection from 172.24.1.174, port 54882
[  5] local 172.24.1.173 port 5201 connected to 172.24.1.174 port 54886
[ ID] Interval           Transfer     Bandwidth
[  5]   0.00-1.00   sec  2.76 GBytes  23.7 Gbits/sec                  
[  5]   1.00-2.00   sec  2.88 GBytes  24.7 Gbits/sec                  
[  5]   2.00-3.00   sec  2.88 GBytes  24.7 Gbits/sec                  
[  5]   3.00-4.00   sec  2.87 GBytes  24.7 Gbits/sec                  
[  5]   4.00-5.00   sec  2.88 GBytes  24.7 Gbits/sec                  
[  5]   5.00-5.04   sec   114 MBytes  24.7 Gbits/sec                  
- - - - - - - - - - - - - - - - - - - - - - - - -
[ ID] Interval           Transfer     Bandwidth
[  5]   0.00-5.04   sec  0.00 Bytes  0.00 bits/sec                  sender
[  5]   0.00-5.04   sec  14.4 GBytes  24.5 Gbits/sec                  receiver
-----------------------------------------------------------
Server listening on 5201
-----------------------------------------------------------

Sivusto2

 [root@112AX-8 ~]# iperf3 -c 172.24.1.173 -i 1 -t 5
Connecting to host 172.24.1.173, port 5201
[  4] local 172.24.1.174 port 54886 connected to 172.24.1.173 port 5201
[ ID] Interval           Transfer     Bandwidth       Retr  Cwnd
[  4]   0.00-1.00   sec  2.87 GBytes  24.7 Gbits/sec   12    734 KBytes       
[  4]   1.00-2.00   sec  2.88 GBytes  24.7 Gbits/sec    0    778 KBytes       
[  4]   2.00-3.00   sec  2.88 GBytes  24.7 Gbits/sec    0    778 KBytes       
[  4]   3.00-4.00   sec  2.87 GBytes  24.7 Gbits/sec    0    786 KBytes       
[  4]   4.00-5.00   sec  2.88 GBytes  24.7 Gbits/sec    0    804 KBytes       
- - - - - - - - - - - - - - - - - - - - - - - - -
[ ID] Interval           Transfer     Bandwidth       Retr
[  4]   0.00-5.00   sec  14.4 GBytes  24.7 Gbits/sec   12             sender
[  4]   0.00-5.00   sec  14.4 GBytes  24.7 Gbits/sec                  receiveriperf Done.

 

Vaikutus

Replikointia ei ole määritetty – site 1 ei ole yhdenmukainen site 2:n kanssa, jos tuotannosta DR-sijaintiin on replikointi, DR-toimipaikka ei voi ohittaa vikasietoskenaarion tapauksessa.

Cause

Varmista, että SDR-prosessi on aloitettu ja vakaa molemmissa sivustoissa – jos näin on, yleinen perimmäinen syy liittyy todennäköisesti sivustojen 1 ja 2 välisiin verkko-ongelmiin, joten PowerFlex ei ole vastuussa alkuperäisen kopion ongelmasta. Tästä huolimatta alkuperäinen kopio ei toimi, ellei verkko-ongelmia käsitellä.

Ongelma voi olla jokin seuraavista:

  1. SDR-IP-osoitteiden väärä määritys
  2. Ei reittiä site1:n SDR:ien ja site2:n SDR:ien välillä
  3. SDR:n IP-roolit on määritetty väärin
  4. Varmista, että palomuuri vahvistaa, että porttia 11088 ei ole estetty
  5. Väärä/kohdistamaton MTU-määritys toimipaikkojen välillä
  6. Mikä tahansa muu verkko-ongelma

Resolution

Kiertotapa

  1. Tarkista SDR:ien väliset yhteydet suorittamalla komento scli --query_disconnection --print_all - tarkistaa, ettei irrallisia SDR:iä ole.
  2. Jos kaikki ovat yhteydessä, mutta ensimmäinen kopiointi epäonnistuu silti, suorita kaistanleveystesti sivustojen 1 ja site2 välillä edellä iperf-esimerkissä kuvatulla tavalla. 

Jos verkko-ongelmia ei löydy ja SDR–SDR-yhteys on kunnossa, suorita kaistanleveystesti. Jos testi onnistuu, mutta ensimmäinen kopiointi epäonnistuu, eskaloi ongelma PowerFlex L3:een.

Huomautus: Jos verkko on kunnossa, mutta lähdetaltio on suuri eikä alkuperäistä kopiointia suoriteta loppuun, etsi käyttöoppaasta vaihtoehto offline-alkukopiointi.  

Versiot, joita ongelma koskee

Kaikki replikointia käyttävät PowerFlex-versiot

Korjattu versiossa

Ongelma ei liity PowerFlexiin

Affected Products

PowerFlex rack, ScaleIO
Article Properties
Article Number: 000204785
Article Type: Solution
Last Modified: 21 Oct 2025
Version:  6
Find answers to your questions from other Dell users
Support Services
Check if your device is covered by Support Services.