RecoverPoint mit VMware SRM: Failover-Vorgänge schlagen fehl, Schritt "Beschreibbaren Storage erstellen"
Summary: VMware Site Recovery Manager (SRM)-Failover- oder Test-Failover-Vorgänge schlagen nach einiger Zeit im Schritt "Beschreibbaren Storage erstellen" fehl: Error – Snapshots von Replikatgeräten konnten nicht erstellt werden. Der SRA-Befehl "testFailoverStart" ist fehlgeschlagen. Fehler beim Öffnen der Sitzung für die Nutzer-zu-Standort-Management-IP. ...
Symptoms
Aufgrund von Site Recovery Manager (SRM)-Testfehlern erhöhen Nutzer die SRM-Timeouts über 31 Minuten und Vorgänge zum Aktivieren des Image-Zugriffs dauern länger als die Timeout-Einstellung.
SRM-Test-Failover oder Failover-Vorgänge können in Schritt 4 fehlschlagen: "Create chitable storage snapshot" nach einer bestimmten Zeit in diesem Schritt (standardmäßig 31 Minuten) mit einem Fehler in den SRM Recovery-Planschritten:
Error - Failed to create snapshots of replica devices. SRA command 'testFailoverStart' failed. Failed opening session for user to site mgmt IP.
Fehler aus SRM-Protokollen (C:\ProgramData\VMware\VMware vCenter Site Recovery Manager\Logs):
--> Feb 20, 2019 3:12:52 PM com.emc.santorini.log.KLogger log --> INFO: Starting to run: TestFailoverStart command --> Feb 20, 2019 3:43:53 PM com.emc.santorini.log.KLogger logWithException --> WARNING: Caught SocketTimeoutException. Please check your network connection to the RPAs. --> javax.xml.ws.WebServiceException: java.net.SocketTimeoutException: Read timed out --> at com.sun.xml.internal.ws.transport.http.client.HttpClientTransport.readResponseCodeAndMessage(Unknown Source) --> at com.sun.xml.internal.ws.transport.http.client.HttpTransportPipe.createResponsePacket(Unknown Source) --> at com.sun.xml.internal.ws.transport.http.client.HttpTransportPipe.process(Unknown Source) --> at com.sun.xml.internal.ws.transport.http.client.HttpTransportPipe.processRequest(Unknown Source) --> at com.sun.xml.internal.ws.transport.DeferredTransportPipe.processRequest(Unknown Source) --> at com.sun.xml.internal.ws.api.pipe.Fiber.__doRun(Unknown Source) --> at com.sun.xml.internal.ws.api.pipe.Fiber._doRun(Unknown Source) --> at com.sun.xml.internal.ws.api.pipe.Fiber.doRun(Unknown Source) --> at com.sun.xml.internal.ws.api.pipe.Fiber.runSync(Unknown Source) --> at com.sun.xml.internal.ws.client.Stub.process(Unknown Source) --> at com.sun.xml.internal.ws.client.sei.SEIStub.doProcess(Unknown Source) --> at com.sun.xml.internal.ws.client.sei.SyncMethodHandler.invoke(Unknown Source) --> at com.sun.xml.internal.ws.client.sei.SyncMethodHandler.invoke(Unknown Source) --> at com.sun.xml.internal.ws.client.sei.SEIStub.invoke(Unknown Source) --> at com.sun.proxy.$Proxy36.testFailoverStartWithOpaques(Unknown Source) --> at com.emc.santorini.handlers.SantoriniLogic.testFailoverStart(SantoriniLogic.java:278) --> at com.emc.santorini.commands.TestFailoverStartCommand.execute(TestFailoverStartCommand.java:40) --> at com.emc.santorini.handlers.SantoriniCommandDispatcher.handleCommandAction(SantoriniCommandDispatcher.java:105) --> at com.emc.santorini.main.SantoriniMain.main(SantoriniMain.java:57) --> Caused by: java.net.SocketTimeoutException: Read timed out ...
Keine Fehler auf RecoverPoint-Seite
Cause
Die standardmäßigen SRM-Timeouts sind auf 5 Minuten festgelegt und können erhöht werden. Wenn sie über 31 Minuten hinaus erhöht werden, kann ein anderes Timeout eintreten – SRA-Timeout kann auftreten, wenn der Image-Zugriffsprozess mehr als 1860 Sekunden (31 Minuten) dauert – WEB_SERVICE_REQUEST_TIMEOUT der standardmäßig auf 1860 Sekunden eingestellt ist.
Resolution
Auflösung:
Passen Sie die SRA-Timeouts an die angeforderten Timeout-Änderungen in SRM an.
SRA-Timeouts werden auf dem SRM-Server festgelegt unter: C:\Program Files\VMware\VMware vCenter Site Recovery Manager\storage\sra\array-type-recoverpoint\conf\cancun_run.properties file
Die Änderungen sollten auf beiden SRM-Servern durchgeführt werden.
Ändern Sie die folgenden Eigenschaften so, dass sie den SRM-Timeouts entsprechen (in Sekunden festgelegt). In diesem Beispiel ist sie auf 1 Stunde bis 3600 Sekunden eingestellt:
VERIFY_PAUSED_TSP_TIMEOUT=3600 VERIFY_REPLICATING_TIMEOUT=3600 VERIFY_TRANSFER_SNAP_SHIPPING_IDLE_TIMEOUT=3600 WEB_SERVICE_REQUEST_TIMEOUT=3600