Точка відновлення: Група узгодженості потрапляє в стан помилки через те, що "SYM не вдалося знайти snapset"
Summary: Точка відновлення: Група узгодженості потрапляє в стан помилки через [SYM не вдалося знайти snapset]
Symptoms
Посилання CG потрапляє в помилку через те, що [SYM не вдалося знайти snapset], що змушує всю групу перейти в увімкнений стан без передачі.
Помилка: Одне або кілька ланок групи cg_name налаштовані на реплікацію знімків, і в процесі реплікації на основі прив'язки сталася помилка. Зі сховища були отримані такі помилки:
Link = cg_name->cg_name_copy, error = [SYM failed to find snapset]
Симптоми, виявлені в журналах:
/files/home/kos/storage/result.log
ActiveXioArrayHelper_AO_IMPL::xioRefreshConsistentSnapshotFromDevice_i: xioRefreshConsistentSnapshotFromDevice Failed with res.faultString() = SYM failed to find snapset res.arrayRvCode() = e_API_FAILURE printCommand: methodName = sym.SystemRemoveSnapSet format = ((ssi)(ssi)(ssi)i) numArgs = 10 buffer = (( 0065ff5a961b41979c64b1998bf9xxxx xms 1 )( xxxxxb824ee14c94b5f708ced17f3b85 XIO-HO-C01 1 )( 6fbb339729954axxxxxxxxxx 1 ) 19558 ) XioConnection::executeCommand: Command execution fail. methodName = sym.SystemRemoveSnapSet m_client = 0x7f502dxxxxx server = 0x7f5xxxxxxxx URL: http://172.xx.xxx.xxx:11111/RPC2 this = 0x7f5030165xxxxx CleanEnvAndReturnRV: Operation failed. rv.faultString() = RPC failed at server. snapset_not_found env.fault_code = -500 XioArrayHelper: RPC failed at server. snapset_not_found, called from function: xioDeleteConsistentSnapshot:3212
/files/home/kos/control/result.log
2018/10/17 10:12:50.135 - #1 - 5040/4313 - WorkManager: GroupCopy(206327186 SiteUID(0x228e3ecc2dxxxxxx) 0): Action refreshArrayConsistentSnapshot failed! value.arrayRvCode() = e_API_FAILURE value.errorStrings() = [SYM failed to find snapset] 2018/10/17 10:12:50.550 - #2 - 5040/4313 - StateChange: lastComputedPipeTargetsMap. copy=GroupCopy(2063271xxx SiteUID(0x228e3ecc2xxxxxxx) 0) to copy= GlobalCopy(SiteUID(0x31ba0c434a00xxxxx) 0) pipe target=PT_CLOSED, reason=No exposed snap to replicate -> PT_CLOSED, reason=Array error
Cause
Через неузгодженість між XtremIO та XMS RecoverPoint отримує попередні записи з XMS, коли отримує поточний список знімків, які потрібно відкинути.
Іноді отримується неочікуване значення, і замість попереднього знімка, який має бути відкинутий, використовується для видалення, як поточний знімок. Це призводить до видалення фактичного знімка.
У зв'язку з цим починають виконуватися збої виклики з Масиву для групи, пов'язаної зі знімком, який був видалений, що призводить до переходу посилання копії в стан помилки [SYM не вдалося знайти snapset], через те, що зв'язок групи знаходиться внизу, весь CG потрапляє в стан помилки enabled без передачі.
Resolution
Спосіб вирішення:
- Вимкніть CG і знову включіть CG
- Змініть t_xioPeriodicalSnapCleanupGatherInterval налаштування з 600000 на 60000000 (x1000) на всіх виробничих RPA. Ця зміна призводить до того, що інструмент очищення запускається раз на тиждень, а не кожні 10 хвилин, що зменшує ймовірність виникнення проблеми.
Резолюція:
Виправлення цієї проблеми доступне в XtremIO 4.0.27-1, XMS 6.2.1-36.
Additional Information
Конфігурації, на які це вплинуло:
RecoverPoint Classic з масивом XtremIO (до XtremIO 4.0.27-1, XMS 6.2.1-36)