RecoverPoint: Konsistensgruppe faller i feiltilstand på grunn av "SYM fant ikke snapset"
Summary: RecoverPoint: Konsistensgruppe faller i feiltilstand på grunn av [SYM finner ikke snapset]
Symptoms
Koblingen til en CG faller inn i en feil på grunn av at [SYM ikke fant snapset] tvinger hele gruppen til en aktivert uten overføringstilstand.
Error: Én eller flere koblinger i gruppe-cg_name er satt til å replikere snaps, og det oppstod en feil i den snap-baserte replikeringsprosessen. Følgende feil ble mottatt fra lagringen:
Link = cg_name->cg_name_copy, error = [SYM failed to find snapset]
Symptomer funnet i logger:
/files/home/kos/storage/result.log
ActiveXioArrayHelper_AO_IMPL::xioRefreshConsistentSnapshotFromDevice_i: xioRefreshConsistentSnapshotFromDevice Failed with res.faultString() = SYM failed to find snapset res.arrayRvCode() = e_API_FAILURE printCommand: methodName = sym.SystemRemoveSnapSet format = ((ssi)(ssi)(ssi)i) numArgs = 10 buffer = (( 0065ff5a961b41979c64b1998bf9xxxx xms 1 )( xxxxxb824ee14c94b5f708ced17f3b85 XIO-HO-C01 1 )( 6fbb339729954axxxxxxxxxx 1 ) 19558 ) XioConnection::executeCommand: Command execution fail. methodName = sym.SystemRemoveSnapSet m_client = 0x7f502dxxxxx server = 0x7f5xxxxxxxx URL: http://172.xx.xxx.xxx:11111/RPC2 this = 0x7f5030165xxxxx CleanEnvAndReturnRV: Operation failed. rv.faultString() = RPC failed at server. snapset_not_found env.fault_code = -500 XioArrayHelper: RPC failed at server. snapset_not_found, called from function: xioDeleteConsistentSnapshot:3212
/files/home/kos/control/result.log
2018/10/17 10:12:50.135 - #1 - 5040/4313 - WorkManager: GroupCopy(206327186 SiteUID(0x228e3ecc2dxxxxxx) 0): Action refreshArrayConsistentSnapshot failed! value.arrayRvCode() = e_API_FAILURE value.errorStrings() = [SYM failed to find snapset] 2018/10/17 10:12:50.550 - #2 - 5040/4313 - StateChange: lastComputedPipeTargetsMap. copy=GroupCopy(2063271xxx SiteUID(0x228e3ecc2xxxxxxx) 0) to copy= GlobalCopy(SiteUID(0x31ba0c434a00xxxxx) 0) pipe target=PT_CLOSED, reason=No exposed snap to replicate -> PT_CLOSED, reason=Array error
Cause
På grunn av feiljustering mellom XtremIO og XMS mottar RecoverPoint tidligere oppføringer fra XMS når den henter gjeldende liste over øyeblikksbilder som må forkastes.
Noen ganger mottas en uventet verdi, og i stedet for det forrige øyeblikksbildet som må forkastes, brukes det som brukes til sletting, som gjeldende øyeblikksbilde. Dette fører til at det faktiske øyeblikksbildet slettes.
På grunn av dette begynner anropene fra arrayet å mislykkes for gruppen som er knyttet til øyeblikksbildet, noe som fører til at koblingen til kopien går inn i feiltilstanden [SYM fant ikke snapset], på grunn av at lenken til gruppen er nede, faller hele CG inn i en feiltilstand aktivert uten overføring.
Resolution
Omgåelse av problemet:
- Deaktiver CG, og aktiver CG på nytt
- Endre justeringen t_xioPeriodicalSnapCleanupGatherInterval fra 600000 til 600000000 (x1000) på alle produksjons-RPA-er. Denne endringen fører til at oppryddingsverktøyet kjører én gang i uken i stedet for hvert 10. minutt, og reduserer sannsynligheten for at problemet oppstår.
Resolusjon:
En hurtigreparasjon for dette problemet er tilgjengelig i XtremIO 4.0.27-1, XMS 6.2.1-36.
Additional Information
Berørte konfigurasjoner:
RecoverPoint Classic med XtremIO-arrayet (før XtremIO 4.0.27-1, XMS 6.2.1-36)