RecoverPoint с VMware SRM: Операции переключения на резервный ресурс завершаются сбоем на шаге «Create writable storage»
Summary: Операции переключения при отказе или тестирования переключения при отказе в VMware Site Recovery Manager (SRM) завершаются сбоем через некоторое время на шаге «Create writeable storage». Ошибка: не удалось создать снимки реплик устройств. Сбой команды SRA «testFailoverStart». Не удалось открыть сессию для IP-адреса управления между пользователем и площадкой. ...
Symptoms
Из-за сбоев тестирования Site Recovery Manager (SRM) пользователи увеличивают время ожидания SRM более 31 минуты, а операции включения доступа к образу занимают больше времени, чем задано временем ожидания.
На шаге 4 могут завершиться сбоем тестового или аварийного переключения SRM: «Create write storage snapshot» через некоторое время на этом шаге (31 минута по умолчанию) с ошибкой в шагах плана восстановления SRM:
Error - Failed to create snapshots of replica devices. SRA command 'testFailoverStart' failed. Failed opening session for user to site mgmt IP.
Ошибки в журналах SRM (C:\ProgramData\VMware\VMware vCenter Site Recovery Manager\Logs).
--> Feb 20, 2019 3:12:52 PM com.emc.santorini.log.KLogger log --> INFO: Starting to run: TestFailoverStart command --> Feb 20, 2019 3:43:53 PM com.emc.santorini.log.KLogger logWithException --> WARNING: Caught SocketTimeoutException. Please check your network connection to the RPAs. --> javax.xml.ws.WebServiceException: java.net.SocketTimeoutException: Read timed out --> at com.sun.xml.internal.ws.transport.http.client.HttpClientTransport.readResponseCodeAndMessage(Unknown Source) --> at com.sun.xml.internal.ws.transport.http.client.HttpTransportPipe.createResponsePacket(Unknown Source) --> at com.sun.xml.internal.ws.transport.http.client.HttpTransportPipe.process(Unknown Source) --> at com.sun.xml.internal.ws.transport.http.client.HttpTransportPipe.processRequest(Unknown Source) --> at com.sun.xml.internal.ws.transport.DeferredTransportPipe.processRequest(Unknown Source) --> at com.sun.xml.internal.ws.api.pipe.Fiber.__doRun(Unknown Source) --> at com.sun.xml.internal.ws.api.pipe.Fiber._doRun(Unknown Source) --> at com.sun.xml.internal.ws.api.pipe.Fiber.doRun(Unknown Source) --> at com.sun.xml.internal.ws.api.pipe.Fiber.runSync(Unknown Source) --> at com.sun.xml.internal.ws.client.Stub.process(Unknown Source) --> at com.sun.xml.internal.ws.client.sei.SEIStub.doProcess(Unknown Source) --> at com.sun.xml.internal.ws.client.sei.SyncMethodHandler.invoke(Unknown Source) --> at com.sun.xml.internal.ws.client.sei.SyncMethodHandler.invoke(Unknown Source) --> at com.sun.xml.internal.ws.client.sei.SEIStub.invoke(Unknown Source) --> at com.sun.proxy.$Proxy36.testFailoverStartWithOpaques(Unknown Source) --> at com.emc.santorini.handlers.SantoriniLogic.testFailoverStart(SantoriniLogic.java:278) --> at com.emc.santorini.commands.TestFailoverStartCommand.execute(TestFailoverStartCommand.java:40) --> at com.emc.santorini.handlers.SantoriniCommandDispatcher.handleCommandAction(SantoriniCommandDispatcher.java:105) --> at com.emc.santorini.main.SantoriniMain.main(SantoriniMain.java:57) --> Caused by: java.net.SocketTimeoutException: Read timed out ...
Ошибки на стороне RecoverPoint отсутствуют
Cause
Время ожидания SRM по умолчанию установлено на 5 минут и может быть увеличено. При увеличении сверх 31 минуты может произойти другой тайм-аут — может возникнуть тайм-аут SRA, если процесс доступа к образу занимает более 1860 секунд (31 минуту), WEB_SERVICE_REQUEST_TIMEOUT, который по умолчанию установлен в 1860 секунд.
Resolution
Разрешение:
Измените время ожидания SRA в соответствии с запрошенными изменениями времени ожидания в SRM.
Тайм-ауты SRA задаются на сервере SRM в разделе: C:\Program Files\VMware\VMware vCenter Site Recovery Manager\storage\sra\array-type-recoverpoint\conf\cancun_run.properties file
Изменения должны быть внесены на обоих серверах SRM.
Измените следующие свойства в соответствии с тайм-аутами SRM (задается в секундах), в данном примере задается значение 1 час - 3600 секунд:
VERIFY_PAUSED_TSP_TIMEOUT=3600 VERIFY_REPLICATING_TIMEOUT=3600 VERIFY_TRANSFER_SNAP_SHIPPING_IDLE_TIMEOUT=3600 WEB_SERVICE_REQUEST_TIMEOUT=3600