RecoverPoint: Skupina konzistence přejde do chybového stavu kvůli chybě "SYM failed to find snapset"
Summary: RecoverPoint: Skupina konzistence přejde do chybového stavu kvůli chybě [SYM failed to find snapset]
Symptoms
Připojení CG spadá do chyby z důvodu události [SYM failed to find snapset], která vynutí přepnutí celé skupiny do povoleného stavu bez přenosu.
Error: Jedna nebo více propojení cg_name skupiny je nastaveno na replikaci snímků a v procesu replikace založené na přichycení došlo k chybě. Z úložiště byly přijaty následující chyby:
Link = cg_name->cg_name_copy, error = [SYM failed to find snapset]
Příznaky nalezeny v logs:
/files/home/kos/storage/result.log
ActiveXioArrayHelper_AO_IMPL::xioRefreshConsistentSnapshotFromDevice_i: xioRefreshConsistentSnapshotFromDevice Failed with res.faultString() = SYM failed to find snapset res.arrayRvCode() = e_API_FAILURE printCommand: methodName = sym.SystemRemoveSnapSet format = ((ssi)(ssi)(ssi)i) numArgs = 10 buffer = (( 0065ff5a961b41979c64b1998bf9xxxx xms 1 )( xxxxxb824ee14c94b5f708ced17f3b85 XIO-HO-C01 1 )( 6fbb339729954axxxxxxxxxx 1 ) 19558 ) XioConnection::executeCommand: Command execution fail. methodName = sym.SystemRemoveSnapSet m_client = 0x7f502dxxxxx server = 0x7f5xxxxxxxx URL: http://172.xx.xxx.xxx:11111/RPC2 this = 0x7f5030165xxxxx CleanEnvAndReturnRV: Operation failed. rv.faultString() = RPC failed at server. snapset_not_found env.fault_code = -500 XioArrayHelper: RPC failed at server. snapset_not_found, called from function: xioDeleteConsistentSnapshot:3212
/files/home/kos/control/result.log
2018/10/17 10:12:50.135 - #1 - 5040/4313 - WorkManager: GroupCopy(206327186 SiteUID(0x228e3ecc2dxxxxxx) 0): Action refreshArrayConsistentSnapshot failed! value.arrayRvCode() = e_API_FAILURE value.errorStrings() = [SYM failed to find snapset] 2018/10/17 10:12:50.550 - #2 - 5040/4313 - StateChange: lastComputedPipeTargetsMap. copy=GroupCopy(2063271xxx SiteUID(0x228e3ecc2xxxxxxx) 0) to copy= GlobalCopy(SiteUID(0x31ba0c434a00xxxxx) 0) pipe target=PT_CLOSED, reason=No exposed snap to replicate -> PT_CLOSED, reason=Array error
Cause
Kvůli nesouladu mezi XtremIO a systémem XMS obdrží řešení RecoverPoint při načítání aktuálního seznamu snapshotů, které je třeba zahodit, předchozí položky ze systému XMS.
V některých případech je přijata neočekávaná hodnota a namísto předchozího snímku, který je nutné zahodit, se použije k odstranění jako aktuální snímek. To způsobí, že se smaže skutečný snímek.
Z tohoto důvodu začnou selhávat volání z pole pro skupinu přidruženou ke snapshotu, která byla odstraněna, což způsobí, že odkaz kopie přejde do chybového stavu [SYM failed to find snapset], protože linka skupiny je mimo provoz, celá CG spadne do chybového stavu enabled bez přenosu.
Resolution
Zástupné řešení:
- Zakažte CG a znovu jej povolte
- Změňte t_xioPeriodicalSnapCleanupGatherInterval vyladění z 600000 na 600000000 (x1000) u všech produkčních RPA. Tato změna způsobí, že se nástroj pro čištění spustí jednou týdně namísto každých 10 minut, a snižuje pravděpodobnost výskytu problému.
Usnesení:
Oprava tohoto problému je k dispozici ve verzích XtremIO 4.0.27-1, XMS 6.2.1-36.
Additional Information
Dotčené konfigurace:
RecoverPoint Classic s polem XtremIO (před XtremIO 4.0.27-1, XMS 6.2.1-36)