RecoverPoint med VMware SRM: Failover-operasjoner mislykkes I trinnet «Opprett skrivbar lagring»
Summary: VMware Site Recovery Manager (SRM) failover eller test-failover-operasjoner mislykkes etter en tid i trinnet "Opprett skrivbar lagring": Feil – kan ikke opprette øyeblikksbilder av replikaenheter. SRA-kommandoen 'testFailoverStart' mislyktes. Mislykket åpningsøkt for bruker til nettsted mgmt IP. ...
Symptoms
På grunn av testfeil i Site Recovery Manager (SRM) øker brukerne SRM-tidsavbruddene utover 31 minutter, og bildetilgang gjør at operasjoner tar mer enn tidsavbruddsinnstillingen.
SRM-test-failover- eller failover-operasjoner kan mislykkes på Trinn 4: "Create writable storage snapshot" etter en tidsperiode på dette trinnet (31 minutter som standard) med feil i trinnene for SRM-gjenopprettingsplan:
Error - Failed to create snapshots of replica devices. SRA command 'testFailoverStart' failed. Failed opening session for user to site mgmt IP.
Feil fra SRM-logger (C:\ProgramData\VMware\VMware vCenter Site Recovery Manager\Logs):
--> Feb 20, 2019 3:12:52 PM com.emc.santorini.log.KLogger log --> INFO: Starting to run: TestFailoverStart command --> Feb 20, 2019 3:43:53 PM com.emc.santorini.log.KLogger logWithException --> WARNING: Caught SocketTimeoutException. Please check your network connection to the RPAs. --> javax.xml.ws.WebServiceException: java.net.SocketTimeoutException: Read timed out --> at com.sun.xml.internal.ws.transport.http.client.HttpClientTransport.readResponseCodeAndMessage(Unknown Source) --> at com.sun.xml.internal.ws.transport.http.client.HttpTransportPipe.createResponsePacket(Unknown Source) --> at com.sun.xml.internal.ws.transport.http.client.HttpTransportPipe.process(Unknown Source) --> at com.sun.xml.internal.ws.transport.http.client.HttpTransportPipe.processRequest(Unknown Source) --> at com.sun.xml.internal.ws.transport.DeferredTransportPipe.processRequest(Unknown Source) --> at com.sun.xml.internal.ws.api.pipe.Fiber.__doRun(Unknown Source) --> at com.sun.xml.internal.ws.api.pipe.Fiber._doRun(Unknown Source) --> at com.sun.xml.internal.ws.api.pipe.Fiber.doRun(Unknown Source) --> at com.sun.xml.internal.ws.api.pipe.Fiber.runSync(Unknown Source) --> at com.sun.xml.internal.ws.client.Stub.process(Unknown Source) --> at com.sun.xml.internal.ws.client.sei.SEIStub.doProcess(Unknown Source) --> at com.sun.xml.internal.ws.client.sei.SyncMethodHandler.invoke(Unknown Source) --> at com.sun.xml.internal.ws.client.sei.SyncMethodHandler.invoke(Unknown Source) --> at com.sun.xml.internal.ws.client.sei.SEIStub.invoke(Unknown Source) --> at com.sun.proxy.$Proxy36.testFailoverStartWithOpaques(Unknown Source) --> at com.emc.santorini.handlers.SantoriniLogic.testFailoverStart(SantoriniLogic.java:278) --> at com.emc.santorini.commands.TestFailoverStartCommand.execute(TestFailoverStartCommand.java:40) --> at com.emc.santorini.handlers.SantoriniCommandDispatcher.handleCommandAction(SantoriniCommandDispatcher.java:105) --> at com.emc.santorini.main.SantoriniMain.main(SantoriniMain.java:57) --> Caused by: java.net.SocketTimeoutException: Read timed out ...
Ingen feil på RecoverPoint-siden
Cause
Standard SRM-tidsavbrudd er satt til 5 minutter og kan økes, når de økes utover 31 minutter, et annet tidsavbrudd – SRA-tidsavbrudd kan forekomme hvis imagetilgangsprosessen tar mer enn 1860 sekunder (31 minutter) – WEB_SERVICE_REQUEST_TIMEOUT som er satt til 1860 sekunder som standard.
Resolution
Oppløsning:
Endre SRA-tidsavbrudd slik at de samsvarer med de forespurte tidsavbruddsendringene i SRM.
SRA-tidsavbrudd angis på SRM-serveren under: C:\Program Files\VMware\VMware vCenter Site Recovery Manager\storage\sra\array-type-recoverpoint\conf\cancun_run.properties file
Endringene bør gjøres på begge SRM-serverne.
Endre følgende egenskaper slik at de samsvarer med SRM-tidsavbrudd (angitt i sekunder), i dette eksemplet er det satt til 1 time – 3600 sekunder:
VERIFY_PAUSED_TSP_TIMEOUT=3600 VERIFY_REPLICATING_TIMEOUT=3600 VERIFY_TRANSFER_SNAP_SHIPPING_IDLE_TIMEOUT=3600 WEB_SERVICE_REQUEST_TIMEOUT=3600