RecoverPoint: Die Konsistenzgruppe wechselt in den Fehlerstatus aufgrund von "SYM konnte den Snapsatz nicht finden"
Summary: RecoverPoint: Die Konsistenzgruppe wechselt in einen Fehlerstatus aufgrund von [SYM konnte Snapset nicht finden]
Symptoms
Der Link einer CG führt zu einem Fehler aufgrund von [SYM failed to find snapset], wodurch die gesamte Gruppe in einen aktivierten Status ohne Übertragung gezwungen wird.
Error: Ein oder mehrere Links der Gruppe cg_name sind so eingestellt, dass Snapshots repliziert werden, und im Snapshot-basierten Replikationsprozess ist ein Fehler aufgetreten. Die folgenden Fehler wurden vom Speicher empfangen:
Link = cg_name->cg_name_copy, error = [SYM failed to find snapset]
Symptome gefunden in logs:
/files/home/kos/storage/result.log
ActiveXioArrayHelper_AO_IMPL::xioRefreshConsistentSnapshotFromDevice_i: xioRefreshConsistentSnapshotFromDevice Failed with res.faultString() = SYM failed to find snapset res.arrayRvCode() = e_API_FAILURE printCommand: methodName = sym.SystemRemoveSnapSet format = ((ssi)(ssi)(ssi)i) numArgs = 10 buffer = (( 0065ff5a961b41979c64b1998bf9xxxx xms 1 )( xxxxxb824ee14c94b5f708ced17f3b85 XIO-HO-C01 1 )( 6fbb339729954axxxxxxxxxx 1 ) 19558 ) XioConnection::executeCommand: Command execution fail. methodName = sym.SystemRemoveSnapSet m_client = 0x7f502dxxxxx server = 0x7f5xxxxxxxx URL: http://172.xx.xxx.xxx:11111/RPC2 this = 0x7f5030165xxxxx CleanEnvAndReturnRV: Operation failed. rv.faultString() = RPC failed at server. snapset_not_found env.fault_code = -500 XioArrayHelper: RPC failed at server. snapset_not_found, called from function: xioDeleteConsistentSnapshot:3212
/files/home/kos/control/result.log
2018/10/17 10:12:50.135 - #1 - 5040/4313 - WorkManager: GroupCopy(206327186 SiteUID(0x228e3ecc2dxxxxxx) 0): Action refreshArrayConsistentSnapshot failed! value.arrayRvCode() = e_API_FAILURE value.errorStrings() = [SYM failed to find snapset] 2018/10/17 10:12:50.550 - #2 - 5040/4313 - StateChange: lastComputedPipeTargetsMap. copy=GroupCopy(2063271xxx SiteUID(0x228e3ecc2xxxxxxx) 0) to copy= GlobalCopy(SiteUID(0x31ba0c434a00xxxxx) 0) pipe target=PT_CLOSED, reason=No exposed snap to replicate -> PT_CLOSED, reason=Array error
Cause
Aufgrund einer Fehlausrichtung zwischen XtremIO und XMS empfängt RecoverPoint beim Abrufen der aktuellen Liste der Snapshots, die verworfen werden müssen, vorherige Einträge vom XMS.
Gelegentlich wird ein unerwarteter Wert empfangen und anstelle des vorherigen Snapshots, der verworfen werden muss, wird er zum Löschen als aktueller Snapshot verwendet. Dies führt dazu, dass der eigentliche Snapshot gelöscht wird.
Aus diesem Grund schlagen die Aufrufe vom Array für die Gruppe fehl, die dem Snapshot zugeordnet ist, der gelöscht wurde, was dazu führt, dass der Link der Kopie in den Fehlerstatus [SYM failed to find snapset] wechselt. Da der Link der Gruppe ausgefallen ist, fällt die gesamte CG in den Fehlerstatus enabled ohne Übertragung.
Resolution
Problemumgehung:
- Deaktivieren Sie die CG und aktivieren Sie sie erneut.
- Ändern Sie die Tweak-t_xioPeriodicalSnapCleanupGatherInterval von 600000 in 600000000 (x1000) auf allen Produktions-RPAs. Diese Änderung führt dazu, dass das Bereinigungstool einmal pro Woche statt alle 10 Minuten ausgeführt wird, wodurch die Wahrscheinlichkeit, dass das Problem auftritt, verringert wird.
Auflösung:
Eine Lösung für dieses Problem ist in XtremIO 4.0.27-1, XMS 6.2.1-36 verfügbar.
Additional Information
Betroffene Konfigurationen:
RecoverPoint Classic mit dem XtremIO-Array (vor XtremIO 4.0.27-1, XMS 6.2.1-36)