PowerProtect:vCenter 在使用適用於虛擬機器的 RecoverPoint 時當機
摘要: vCenter vpxd 服務發生錯誤並會在 vCenter 工作期間啟用或停用輕量型 Delta (LWD) 保護時發生錯誤並當機。啟用或停用 PowerProtect Data Manager TSDM 保護所需的工作。
症狀
vCenter vpxd 服務發生錯誤並當機,在當機前觀察到以下情況:
- PowerProtect Data Manager TSDM 備份
- 從 TSDM 保護原則新增或移除的虛擬機器 (VM)。
- 啟用或停用 LWD 保護的 vCenter 工作 -
"Disable LWD-based data protection"或"EnableLWD-based data protection" - 已設定虛擬機器 6.0.x 版的 RecoverPoint。
若虛擬機器 (VM) 受到 PowerProtect Data Manager (TSDM) 保護,則 VM 及其相關聯的磁碟都必須啟用 VMware LWD I/O Filter。但是,如果虛擬機器 I/O 篩選器的 RecoverPoint 也存在,此組態可能會在 vCenter vpxd 服務中觸發錯誤。
vCenter 記錄:vpxd.log
記錄位置: /var/log/vmware/vpxd
發生錯誤時,vpxd 記錄可能會結束類似以下內容的工作:
2025-09-05T13:58:22.692Z info vpxd[3928813] [Originator@6876 sub=provisioning opID=21dfd9d8-d9da-7a] Extra overhead memory required for LWD protect is : 30
2025-09-05T13:58:22.692Z info vpxd[3928813] [Originator@6876 sub=provisioning opID=21dfd9d8-d9da-7a] CurrentOverhead = 50, currentOverheadLimit = 139, availableOverheadResv = 89
2025-09-05T13:58:22.692Z info vpxd[3928813] [Originator@6876 sub=provisioning opID=21dfd9d8-d9da-7a] ExtraOverheadForLWD = 0, needMinLimitBump = false, isLwdIoFilterReconfig = true
2025-09-05T13:58:22.697Z info vpxd[3928813] [Originator@6876 sub=VdbOpJournal opID=21dfd9d8-d9da-7a] Added new journal id=4 type=1
2025-09-05T13:58:22.697Z info vpxd[3928813] [Originator@6876 sub=vpxLro opID=21dfd9d8-d9da-7a-01] [VpxLRO] -- BEGIN lro-2565 -- vm-17025 -- vim.VirtualMachine.reconfigure -- 5287b933-8b08-09b0-f3b8-73d40f6450de(5201c450-9da7-cdaa-c646-94c2c2f4e599)
這與 PowerProtect Data Manager 要求在 vCenter 上的工作吻合。
記錄:vmdm.log
記錄位置: /var/log/brs/vmdm
2025-08-31T18:11:37.307Z INFO [] [https-jsse-nio-0.0.0.0-8447-exec-479] [00000000-0000-4000-a000-000000000000][][][TRACE_ID:825e8776gt67y7u8;JOB_ID:8b461hygt67y776][] [c.e.b.v.v.a.VPEProtectOp.prepareDisks(798)] - VM LinuxVM 4yg76y78-3114-5450-af8c-62gghy78u8i9 have disks included. Enabling LWD filter
由於 vCenter vpxd 故障,PowerProtect Data Manager vmdm 回報警告:
將虛擬機器新增至保護原則時:
2025-09-05T14:09:13.082Z WARN [] [vpe-thread-6] [00000000-0000-4000-a000-000000000000][][][TRACE_ID:9562721386df306b;JOB_ID:9ca442dea70d8d9e][] [c.e.b.v.v.a.VPEConfigureOp.logErrorStack(64)] - Unable to configure rhel-client02.amer.lan
從保護原則移除虛擬機器時:
2025-09-05T14:08:43.956Z WARN [] [vpe-thread-6] [00000000-0000-4000-a000-000000000000][][][TRACE_ID:b7d78430774e6984;JOB_ID:8c2a181826f2e416][] [c.e.b.v.v.u.VPEProtectionUtils.unConfigureAsset(853)] - Failed to unconfigure asset
com.emc.brs.vmdm.error.InternalServerErrorException: Unable to wait for Vsan task
at com.emc.brs.vmdm.vpe.util.SdmEnableProtectUtil.waitForVsanTask(SdmEnableProtectUtil.java:506)
at com.emc.brs.vmdm.vpe.util.SdmEnableProtectUtil.configureProtect(SdmEnableProtectUtil.java:473)
at com.emc.brs.vmdm.vpe.util.SdmEnableProtectUtil.configureProtection(SdmEnableProtectUtil.java:257)
at com.emc.brs.vmdm.vpe.util.SdmEnableProtectUtil.configureProtection(SdmEnableProtectUtil.java:272)
at com.emc.brs.vmdm.vpe.util.VPEProtectionUtils.unConfigureAsset(VPEProtectionUtils.java:849)
at com.emc.brs.vmdm.vpe.actions.VPEUnconfigureOp.execute(VPEUnconfigureOp.java:42)
at com.emc.brs.vmdm.vpe.service.VPEActionDispatcher.execute(VPEActionDispatcher.java:408)
at com.emc.brs.vmdm.vpe.service.VPEActionDispatcher.lambda$executeOp$1(VPEActionDispatcher.java:362)
at com.emc.brs.vmdm.vpe.util.ResourceUtils$JobExecutorImpl.lambda$createWorkflowTask$0(ResourceUtils.java:186)
at java.base/java.util.concurrent.Executors$RunnableAdapter.call(Executors.java:539)
at java.base/java.util.concurrent.FutureTask.run(FutureTask.java:264)
at java.base/java.util.concurrent.ThreadPoolExecutor.runWorker(ThreadPoolExecutor.java:1136)
at java.base/java.util.concurrent.ThreadPoolExecutor$Worker.run(ThreadPoolExecutor.java:635)
at java.base/java.lang.Thread.run(Thread.java:840)
Caused by: com.vmware.vsan.sdk.RuntimeFaultFaultMsg: Connection was closed by the remote peer
如果備份開始時未啟用 VMware LWD I/O 篩選器,則必須先完成對應的 vCenter 工作,才能繼續備份。當原始配置作業失敗時,會發生這種情況。範例警告:
2025-09-05T14:08:43.956Z WARN [] [https-jsse-nio-0.0.0.0-8447-exec-479] [00000000-0000-4000-a000-000000000000][][][TRACE_ID:b7d78430774e6984;JOB_ID:8c2a181826f2e416][] [c.e.b.v.v.a.VPEProtectOp.logErrorStack(64)] - Unable to create backup
com.emc.brs.vmdm.error.InternalServerErrorException: Unable to wait for Vsan task
原因
任何類型的備份解決方案 (包括 PowerProtect Data Manager) 都不支援 RecoverPoint 6.0.x 版。
從過去來看,適用於虛擬機器 5.x 的 RecoverPoint 一直與資料保護產品一起運作和共存。自從 VAIO 在 6.0 版中推出以來,當與用於數據保護 (VADP) 或透明快照的 vStorage 應用程式程式設計介面 (API) 一起使用時,出現了各種現場問題。
升級到版本 6.0.x 後,出現了產品問題的報告,包括 RP4VM 和各種資料保護產品中的故障和不穩定。下列知識庫文章說明這些問題:VM 6.x 的 RecoverPoint:支援備份解決方案
儘管 RecoverPoint 6.x-6.0.2.x 正式不支援與任何資料保護產品共存,但上述文章包含增加 ESXI VM 記憶體負荷的潛在因應措施。此因應措施不適用於 vCenter vpxd 錯誤問題或對 PPDM TSDM 的支援,它僅與 VADP 相關。
如有虛擬機器支援的 RecoverPoint 相關問題,請聯絡 RecoverPoint 支援團隊。
解析度
動作:從虛擬機器的 RecoverPoint 中取消保護虛擬機器,以防止其他 vCenter 服務當機,並成功完成備份。
截至 2025 年 9 月,沒有任何因應措施,虛擬機器的 RecoverPoint 不支援與 TSDM 一起使用。RecoverPoint 正在努力解決,以搭配 VADP 備份使用。
如需虛擬機器 6.0.x 版的最新 RecoverPoint 支援狀態以及備份解決方案,請向 RecoverPoint 團隊開立服務要求。參考 KB 文章 VM 6.x 的 RecoverPoint:支援備份解決方案。