RecoverPoint con VMware SRM: Passaggio "Create writable storage" per le operazioni di failover non riuscite
Summary: Le operazioni di failover o failover di test di VMware Site Recovery Manager (SRM) non riescono dopo un certo periodo di tempo nel passaggio "Create writable storage": Errore: impossibile creare istantanee dei dispositivi di replica. Il comando SRA "testFailoverStart" non è riuscito. Impossibile aprire la sessione per l'IP di gestione da utente a sito. ...
Symptoms
A causa degli errori di test di Site Recovery Manager (SRM), gli utenti aumentano i timeout di SRM oltre 31 minuti e le operazioni di abilitazione dell'accesso all'immagine richiedono più tempo rispetto all'impostazione di timeout.
Le operazioni di failover o di test SRM potrebbero non riuscire nel passaggio 4: "Create writable storage snapshot" dopo un periodo di tempo in questo passaggio (31 minuti per impostazione predefinita) con errore nei passaggi del piano di ripristino SRM:
Error - Failed to create snapshots of replica devices. SRA command 'testFailoverStart' failed. Failed opening session for user to site mgmt IP.
Errori dai registri SRM (C:\ProgramData\VMware\VMware vCenter Site Recovery Manager\Logs):
--> Feb 20, 2019 3:12:52 PM com.emc.santorini.log.KLogger log --> INFO: Starting to run: TestFailoverStart command --> Feb 20, 2019 3:43:53 PM com.emc.santorini.log.KLogger logWithException --> WARNING: Caught SocketTimeoutException. Please check your network connection to the RPAs. --> javax.xml.ws.WebServiceException: java.net.SocketTimeoutException: Read timed out --> at com.sun.xml.internal.ws.transport.http.client.HttpClientTransport.readResponseCodeAndMessage(Unknown Source) --> at com.sun.xml.internal.ws.transport.http.client.HttpTransportPipe.createResponsePacket(Unknown Source) --> at com.sun.xml.internal.ws.transport.http.client.HttpTransportPipe.process(Unknown Source) --> at com.sun.xml.internal.ws.transport.http.client.HttpTransportPipe.processRequest(Unknown Source) --> at com.sun.xml.internal.ws.transport.DeferredTransportPipe.processRequest(Unknown Source) --> at com.sun.xml.internal.ws.api.pipe.Fiber.__doRun(Unknown Source) --> at com.sun.xml.internal.ws.api.pipe.Fiber._doRun(Unknown Source) --> at com.sun.xml.internal.ws.api.pipe.Fiber.doRun(Unknown Source) --> at com.sun.xml.internal.ws.api.pipe.Fiber.runSync(Unknown Source) --> at com.sun.xml.internal.ws.client.Stub.process(Unknown Source) --> at com.sun.xml.internal.ws.client.sei.SEIStub.doProcess(Unknown Source) --> at com.sun.xml.internal.ws.client.sei.SyncMethodHandler.invoke(Unknown Source) --> at com.sun.xml.internal.ws.client.sei.SyncMethodHandler.invoke(Unknown Source) --> at com.sun.xml.internal.ws.client.sei.SEIStub.invoke(Unknown Source) --> at com.sun.proxy.$Proxy36.testFailoverStartWithOpaques(Unknown Source) --> at com.emc.santorini.handlers.SantoriniLogic.testFailoverStart(SantoriniLogic.java:278) --> at com.emc.santorini.commands.TestFailoverStartCommand.execute(TestFailoverStartCommand.java:40) --> at com.emc.santorini.handlers.SantoriniCommandDispatcher.handleCommandAction(SantoriniCommandDispatcher.java:105) --> at com.emc.santorini.main.SantoriniMain.main(SantoriniMain.java:57) --> Caused by: java.net.SocketTimeoutException: Read timed out ...
Nessun errore sul lato RecoverPoint
Cause
I timeout SRM predefiniti sono impostati su 5 minuti e possono essere aumentati; se aumentati oltre i 31 minuti, potrebbe verificarsi un timeout diverso: il timeout SRA può verificarsi se il processo di accesso all'immagine richiede più di 1.860 secondi (31 minuti), WEB_SERVICE_REQUEST_TIMEOUT che è impostato su 1.860 secondi per impostazione predefinita.
Resolution
Risoluzione:
Modificare i timeout SRA in modo che corrispondano alle modifiche timeout richieste in SRM.
I timeout SRA vengono impostati sul server SRM in: C:\Program Files\VMware\VMware vCenter Site Recovery Manager\storage\sra\array-type-recoverpoint\conf\cancun_run.properties file
Le modifiche devono essere apportate su entrambi i server SRM.
Modificare le seguenti proprietà in modo che corrispondano ai timeout SRM (impostati in secondi), in questo esempio impostati su 1 ora - 3.600 secondi:
VERIFY_PAUSED_TSP_TIMEOUT=3600 VERIFY_REPLICATING_TIMEOUT=3600 VERIFY_TRANSFER_SNAP_SHIPPING_IDLE_TIMEOUT=3600 WEB_SERVICE_REQUEST_TIMEOUT=3600