RecoverPoint: Konsistensgruppe falder i fejltilstand på grund af "SYM kunne ikke finde snapset"
Summary: RecoverPoint: Konsistensgruppe falder i fejltilstand på grund af [SYM kunne ikke finde snapset]
Symptoms
Linket til en CG falder i en fejl på grund af [SYM kunne ikke finde snapset], der tvinger hele gruppen til en aktiveret uden overførselstilstand.
Fejl: Et eller flere links i gruppe cg_name er indstillet til at replikere snaps, og der opstod en fejl i den snap-baserede replikeringsproces. Følgende fejl blev modtaget fra lageret:
Link = cg_name->cg_name_copy, error = [SYM failed to find snapset]
Symptomer fundet i logfiler:
/files/home/kos/storage/result.log
ActiveXioArrayHelper_AO_IMPL::xioRefreshConsistentSnapshotFromDevice_i: xioRefreshConsistentSnapshotFromDevice Failed with res.faultString() = SYM failed to find snapset res.arrayRvCode() = e_API_FAILURE printCommand: methodName = sym.SystemRemoveSnapSet format = ((ssi)(ssi)(ssi)i) numArgs = 10 buffer = (( 0065ff5a961b41979c64b1998bf9xxxx xms 1 )( xxxxxb824ee14c94b5f708ced17f3b85 XIO-HO-C01 1 )( 6fbb339729954axxxxxxxxxx 1 ) 19558 ) XioConnection::executeCommand: Command execution fail. methodName = sym.SystemRemoveSnapSet m_client = 0x7f502dxxxxx server = 0x7f5xxxxxxxx URL: http://172.xx.xxx.xxx:11111/RPC2 this = 0x7f5030165xxxxx CleanEnvAndReturnRV: Operation failed. rv.faultString() = RPC failed at server. snapset_not_found env.fault_code = -500 XioArrayHelper: RPC failed at server. snapset_not_found, called from function: xioDeleteConsistentSnapshot:3212
/files/home/kos/control/result.log
2018/10/17 10:12:50.135 - #1 - 5040/4313 - WorkManager: GroupCopy(206327186 SiteUID(0x228e3ecc2dxxxxxx) 0): Action refreshArrayConsistentSnapshot failed! value.arrayRvCode() = e_API_FAILURE value.errorStrings() = [SYM failed to find snapset] 2018/10/17 10:12:50.550 - #2 - 5040/4313 - StateChange: lastComputedPipeTargetsMap. copy=GroupCopy(2063271xxx SiteUID(0x228e3ecc2xxxxxxx) 0) to copy= GlobalCopy(SiteUID(0x31ba0c434a00xxxxx) 0) pipe target=PT_CLOSED, reason=No exposed snap to replicate -> PT_CLOSED, reason=Array error
Cause
På grund af en forkert justering mellem XtremIO og XMS modtager RecoverPoint tidligere poster fra XMS, når den henter den aktuelle liste over snapshots, der skal kasseres.
Af og til modtages en uventet værdi, og i stedet for at det forrige snapshot, som skal kasseres, bruges det til sletning som det aktuelle snapshot. Dette medfører, at det faktiske snapshot slettes.
På grund af dette begynder kaldene fra arrayet at mislykkes for gruppen, der er knyttet til snapshottet, som blev slettet, hvilket får linket til kopien til at gå ind i fejltilstanden for [SYM kunne ikke finde snapset], på grund af at linket til gruppen er nede, falder hele CG i en fejltilstand aktiveret uden overførsel.
Resolution
Løsning:
- Deaktiver CG, og genaktiver CG
- Skift justerings t_xioPeriodicalSnapCleanupGatherInterval fra 600000 til 600000000 (x1000) på alle produktions-RPA'er. Denne ændring får oprydningsværktøjet til at køre en gang om ugen i stedet for hvert 10. minut og reducerer sandsynligheden for at støde på problemet.
Opløsning:
En løsning til dette problem er tilgængelig i XtremIO 4.0.27-1, XMS 6.2.1-36.
Additional Information
Påvirkede konfigurationer:
RecoverPoint Classic med XtremIO-systemet (før XtremIO 4.0.27-1, XMS 6.2.1-36)