NVP-vProxy:VM 在快照移除程序期間失去連線。

摘要: 在 vProxy 作業的快照刪除步驟中,源虛擬機 (VM) 暫時失去連接。

本文章適用於 本文章不適用於 本文無關於任何特定產品。 本文未識別所有產品版本。

症狀

vProxy 備份工作階段記錄會顯示快照要求發出的時間:

YYYY/MM/DD HH:MM:SS TRACE: [NW_BUILD] Sending remove snapshot request to Snapshot Manager ...
YYYY/MM/DD HH:MM:SS TRACE: [NW_BUILD] Sending remove snapshot request to Snapshot Manager ...
YYYY/MM/DD HH:MM:SS INFO: [NW_BUILD] Remove snapshot request accepted by Snapshot Manager.
YYYY/MM/DD HH:MM:SS INFO: [NW_BUILD] Remove snapshot request accepted by Snapshot Manager.
注意:工作階段記錄可在 vProxy 的 /opt/emc/vproxy/runtime/logs/vbackupd//opt/emc/vproxy/runtime/logs/recycle/vbackupd/ 下找到


vProxy vbackupd-snapmgr.log可能會顯示錯誤,例如:

YYYY/MM/DD HH:MM:SS INFO: Found virtual machine "VM-NAME" with MORef "vm-###".
YYYY/MM/DD HH:MM:SS NOTICE: Virtual machine "VM-NAME" requires consolidation of its virtual disks.
YYYY/MM/DD HH:MM:SS ERROR: Failed to complete consolidation of virtual disks for "VM-NAME" (vm-###): Unable to access file since it is locked
YYYY/MM/DD HH:MM:SS WARN: Failed to consolidate virtual disks of virtual machine "VM-NAME" (vm-###): Failed to complete consolidation of virtual disks for "VM-NAME" (vm-###): Unable to access file since it is locked.
YYYY/MM/DD HH:MM:SS WARN: Failed to consolidate virtual disks of virtual machine "VM-NAME" (vm-###): Failed to complete consolidation of virtual disks for "VM-NAME" (vm-###): Unable to access file since it is locked.
YYYY/MM/DD HH:MM:SS NOTICE: Snapshot "snapshot-###" of virtual machine "VM-NAME" (vm-###) was removed.
注意:您可以在以下位置找到vbackupd-snapmgr.log:  /opt/emc/vproxy/runtime/logs/vbackupd/ /opt/emc/vproxy/runtime/logs/recycle/daemon/


VM 作業系統上的事件記錄可能會顯示錯誤,例如:

The mirroring connection to "TCP://VM-NAME:5022" has timed out for database "out" after 10 seconds without a response. Check the service and network connections"
Event ID: 1479.

VM 的vmware.log (位於 VM 的 VMware 資料存放區資料夾中) 可能包含有關快照移除程序的其他資訊。

原因

NetWorker/vProxy 不會移除快照本身。VMware vCenter 可控制 VM 快照的建立、管理和刪除。NetWorker 傳送要求至 VMware 以建立快照的方式啟動備份。最後,它會傳送刪除快照的要求。

移除快照會降低每秒 VM 輸入/輸出 (IOPS)。發生這種情況的原因,是由於中繼資料更新增加以及在移除程序期間增加的 IOP 負載導致額外的虛擬機器檔案系統 (VMFS) 儲存鎖定。如果目標儲存在 30% 至 40% 的 IOP 負載以上執行,則移除快照可能會將其推至 80% 以上。此峰值通常會導致延遲,從而損害應用程式性能。

NVP vProxy:故障診斷 NetWorker 備份期間的 VMware 快照問題。

解析度

隔離測試:

若要將問題隔離至特定的 VMware 快照移除事件,請執行下列步驟:
 
警告:在與 VM 的連接不敏感時執行以下步驟,例如在非高峰時段。
  1. 登入 vCenter Server 或 vSphere Client。
  2. 在所要的 VM 上建立快照。
  3. 將 VM 上的快照保留一段時間,瞭解 vProxy 作業針對 VM 的執行時間。
  4. 針對虛擬機器的 IP 位址/主機名稱啟動 ping 命令。
Linux:
ping -D VM_IP
Windows (Powershell): 
ping -t VM_IP | Foreach{"{0} - {1}" -f (Get-Date),$_}
上述兩個命令都會為 ping 加上時間戳記。 
  1. 移除快照。
  2. 在刪除快照期間觀察虛擬機器。
如果在執行上述測試時,發現與 vProxy 備份工作期間相同的連線問題,則問題可能存在於 VMware 環境中。向 VMware 支援開立支援票證以進一步調查。

若為儲存在 NFSv3 資料存放區的虛擬機器:

如果您要備份儲存在 NFSv3 資料存放區的虛擬機器,並且發現連線問題,請參閱 VMware KB: https://kb.vmware.com/s/article/2010953此超連結會帶您前往 Dell Technologies 以外的網站。

使用 8.0u2b (或更新版本) 的 VMware ESXi 主機時,VMware 會回報此特定問題已解決下列

選項適用於使用 8.0u2b 之前 ESXi 版本的 NFSv3 的解決方案。必須考慮以下選項之一。
  • 在與正在眩暈的虛擬機器相同的 ESXi 主機上部署 NVP vProxy 裝置。
  • 請考慮使用 NFSv4 通訊協定掛接 NFS 資料存放區。 
注意:在實作 NFS 4.1 之前,請參閱 NFS 通訊協定和 vSphere 解決方案 - vSphere 環境中的 NFS 資料存放區概念與作業此超連結會帶您前往 Dell Technologies 以外的網站。NFS 4.1 使用與 NFSv3 不同的鎖定機制 - 請參閱鎖定機制。
  • 設定備份這些 VM 的 vProxy 裝置,以使用 NBD 而非 HotAdd。盡可能使用熱添加是首選,因為它通常比 NBD 性能更好。高 NBD 負載可能會對 VMware 管理網路造成負面影響。僅當提到的其他選項不可行時,才應執行此選項。 
vProxy 可設定為僅使用 NBD 進行備份。從 NetWorker Management Console (NMC)-->裝置-->VMware 代理:
NBD 工作階段設定
注意:將「熱添加」設置為 0 將禁用熱添加傳輸模式。 

其他資訊

其他故障診斷:

  • 在沒有任何工作執行時檢查 VM 是否有快照,並移除任何找到的快照。
  • 檢查虛擬機器上是否有孤立的快照。 
  • 減少該資料存放區/主機上發生的並行虛擬機器備份數量。如需效能和擴充能力建議,請參閱 NetWorker VMware 整合指南。https://www.dell.com/support/home/product-support/product/networker/docs
  • 如果在快照整合期間,VM 的 CPU 資源大幅增加,請考慮增加該 VM 的 CPU 預留。
  • 將 VM 移至具有更多可用資源的主機。
  • 如果 VM 是 vCenter Server 應用裝置,請參閱 NetWorker VMware 整合指南中的 vCenter 伺服器備份與還原的最佳實務https://www.dell.com/support/home/product-support/product/networker/docs


VMware KB 1002836此超連結會帶您前往 Dell Technologies 以外的網站。 |快照移除可能會使虛擬機長時間停止。

檢閱 VMware vCenter 支援套裝,確保為代管出現此症狀的 VM 的 ESXi 系統收集 ESXi 系統記錄。在快照作業期間,ESXi 主機的 \var\run\log\vmkernel.log 可能會顯示儲存裝置延遲問題:

YYYY-MM-DDTHH:mm:SS cpu10:2098132)WARNING: ScsiDeviceIO: 1498: Device naa.############# performance has deteriorated. I/O latency increased from average value of 1429 microseconds to 29874 microseconds.

必須與儲存裝置廠商接洽,以進行進一步調查。

受影響的產品

NetWorker

產品

NetWorker
文章屬性
文章編號: 000167629
文章類型: Solution
上次修改時間: 10 11月 2025
版本:  8
向其他 Dell 使用者尋求您問題的答案
支援服務
檢查您的裝置是否在支援服務的涵蓋範圍內。