RecoverPoint: Konsekvensgruppen hamnar i feltillståndet på grund av "SYM kunde inte hitta snapset"
Summary: RecoverPoint: Konsekvensgruppen hamnar i feltillstånd på grund av [SYM kunde inte hitta snapset]
Symptoms
Länken till en CG hamnar i ett fel på grund av att [SYM misslyckades med att hitta snapset] tvingar hela gruppen till ett aktiverat utan överföringsläge.
Fel: En eller flera länkar i grupp cg_name är inställda på att replikera ögonblicksbilder och ett fel uppstod i den ögonblicksbildsbaserade replikeringsprocessen. Följande fel togs emot från lagringen:
Link = cg_name->cg_name_copy, error = [SYM failed to find snapset]
Symptom som hittats i loggar:
/files/home/kos/storage/result.log
ActiveXioArrayHelper_AO_IMPL::xioRefreshConsistentSnapshotFromDevice_i: xioRefreshConsistentSnapshotFromDevice Failed with res.faultString() = SYM failed to find snapset res.arrayRvCode() = e_API_FAILURE printCommand: methodName = sym.SystemRemoveSnapSet format = ((ssi)(ssi)(ssi)i) numArgs = 10 buffer = (( 0065ff5a961b41979c64b1998bf9xxxx xms 1 )( xxxxxb824ee14c94b5f708ced17f3b85 XIO-HO-C01 1 )( 6fbb339729954axxxxxxxxxx 1 ) 19558 ) XioConnection::executeCommand: Command execution fail. methodName = sym.SystemRemoveSnapSet m_client = 0x7f502dxxxxx server = 0x7f5xxxxxxxx URL: http://172.xx.xxx.xxx:11111/RPC2 this = 0x7f5030165xxxxx CleanEnvAndReturnRV: Operation failed. rv.faultString() = RPC failed at server. snapset_not_found env.fault_code = -500 XioArrayHelper: RPC failed at server. snapset_not_found, called from function: xioDeleteConsistentSnapshot:3212
/files/home/kos/control/result.log
2018/10/17 10:12:50.135 - #1 - 5040/4313 - WorkManager: GroupCopy(206327186 SiteUID(0x228e3ecc2dxxxxxx) 0): Action refreshArrayConsistentSnapshot failed! value.arrayRvCode() = e_API_FAILURE value.errorStrings() = [SYM failed to find snapset] 2018/10/17 10:12:50.550 - #2 - 5040/4313 - StateChange: lastComputedPipeTargetsMap. copy=GroupCopy(2063271xxx SiteUID(0x228e3ecc2xxxxxxx) 0) to copy= GlobalCopy(SiteUID(0x31ba0c434a00xxxxx) 0) pipe target=PT_CLOSED, reason=No exposed snap to replicate -> PT_CLOSED, reason=Array error
Cause
På grund av en feljustering mellan XtremIO och XMS tar RecoverPoint emot tidigare poster från XMS när den hämtar den aktuella listan med snapshots som måste kasseras.
Ibland tas ett oväntat värde emot och i stället för att den tidigare ögonblicksbilden som måste tas bort används för borttagning som den aktuella ögonblicksbilden. Då tas den faktiska snapshoten bort.
På grund av detta börjar anropen från matrisen att misslyckas för gruppen som är associerad med ögonblicksbilden som raderades, vilket gör att länken till kopian går in i feltillståndet [SYM misslyckades med att hitta snapset], på grund av att länken till gruppen är nere hamnar hela CG i feltillståndet aktiverat utan överföring.
Resolution
Alternativ lösning:
- Inaktivera CG och återaktivera CG
- Ändra justeringen t_xioPeriodicalSnapCleanupGatherInterval från 600000 till 600000000 (x1000) för alla RPA:er för produktion. Den här ändringen gör att rensningsverktyget körs en gång i veckan i stället för var 10:e minut och minskar sannolikheten för att problemet uppstår.
Resolution:
En korrigering för det här problemet finns i XtremIO 4.0.27-1, XMS 6.2.1-36.
Additional Information
Påverkade konfigurationer:
RecoverPoint Classic med XtremIO-disksystem (före XtremIO 4.0.27-1, XMS 6.2.1-36)