RecoverPoint: Grupa spójności przechodzi w stan błędu z powodu komunikatu "SYM nie znalazł zestawu przyciągania"
Summary: RecoverPoint: Grupa spójności przechodzi w stan błędu z powodu [SYM nie znalazł zestawu przyciągania]
Symptoms
Łącze grupy grafiki napotyka błąd, ponieważ [SYM nie udało się znaleźć zestawu], co wymusza przejście całej grupy w stan włączony bez transferu.
Error: Co najmniej jedno łącze grupy cg_name jest ustawionych na replikację przyciągań, a w procesie replikacji opartej na przystawkach wystąpił błąd. Z magazynu wystąpiły następujące błędy:
Link = cg_name->cg_name_copy, error = [SYM failed to find snapset]
Objawy znalezione w dziennikach:
/files/home/kos/storage/result.log
ActiveXioArrayHelper_AO_IMPL::xioRefreshConsistentSnapshotFromDevice_i: xioRefreshConsistentSnapshotFromDevice Failed with res.faultString() = SYM failed to find snapset res.arrayRvCode() = e_API_FAILURE printCommand: methodName = sym.SystemRemoveSnapSet format = ((ssi)(ssi)(ssi)i) numArgs = 10 buffer = (( 0065ff5a961b41979c64b1998bf9xxxx xms 1 )( xxxxxb824ee14c94b5f708ced17f3b85 XIO-HO-C01 1 )( 6fbb339729954axxxxxxxxxx 1 ) 19558 ) XioConnection::executeCommand: Command execution fail. methodName = sym.SystemRemoveSnapSet m_client = 0x7f502dxxxxx server = 0x7f5xxxxxxxx URL: http://172.xx.xxx.xxx:11111/RPC2 this = 0x7f5030165xxxxx CleanEnvAndReturnRV: Operation failed. rv.faultString() = RPC failed at server. snapset_not_found env.fault_code = -500 XioArrayHelper: RPC failed at server. snapset_not_found, called from function: xioDeleteConsistentSnapshot:3212
/pliki/home/kos/control/result.log
2018/10/17 10:12:50.135 - #1 - 5040/4313 - WorkManager: GroupCopy(206327186 SiteUID(0x228e3ecc2dxxxxxx) 0): Action refreshArrayConsistentSnapshot failed! value.arrayRvCode() = e_API_FAILURE value.errorStrings() = [SYM failed to find snapset] 2018/10/17 10:12:50.550 - #2 - 5040/4313 - StateChange: lastComputedPipeTargetsMap. copy=GroupCopy(2063271xxx SiteUID(0x228e3ecc2xxxxxxx) 0) to copy= GlobalCopy(SiteUID(0x31ba0c434a00xxxxx) 0) pipe target=PT_CLOSED, reason=No exposed snap to replicate -> PT_CLOSED, reason=Array error
Cause
Ze względu na niezgodność między XtremIO a XMS funkcja RecoverPoint otrzymuje poprzednie wpisy z XMS, gdy pobiera bieżącą listę migawek, które należy odrzucić.
Od czasu do czasu odbierana jest nieoczekiwana wartość i zamiast poprzedniej migawki, która musi zostać odrzucona, używana jest do usunięcia, jako bieżąca migawka. Spowoduje to usunięcie rzeczywistej migawki.
Z tego powodu wywołania z macierzy zaczynają kończyć się niepowodzeniem dla grupy powiązanej z migawką, która została usunięta, co powoduje, że łącze kopii przechodzi w stan błędu [SYM nie znalazł zestawu migawek], ponieważ łącze grupy nie działa, cała grupa CG przechodzi w stan błędu włączony bez przesyłania.
Resolution
Obejście problemu:
- Wyłącz grupę spójności i ponownie ją włącz
- Zmień t_xioPeriodicalSnapCleanupGatherInterval modyfikacji z 600000 na 600000000 (x1000) na wszystkich produkcyjnych RPA. Ta zmiana powoduje, że narzędzie do czyszczenia jest uruchamiane raz w tygodniu zamiast co 10 minut, co zmniejsza prawdopodobieństwo wystąpienia problemu.
Rezolucja:
Rozwiązanie tego problemu jest dostępne w XtremIO 4.0.27-1, XMS 6.2.1-36.
Additional Information
Konfiguracje, których dotyczy problem:
RecoverPoint Classic z macierzą XtremIO (przed XtremIO 4.0.27-1, XMS 6.2.1-36)