RecoverPoint for VMs:5.3.4.1 和 6.0.1.x 中的拆分器生成 DCUI 登录请求
Summary: 将拆分器 VIB 升级到 5.3.4.1 或安装 6.0.1.x 版本后,拆分器进程将在 vCenter 上生成许多 DCUI 登录请求。
Symptoms
将 RecoverPoint Splitter/Kdriver VIB 升级到 5.3.4.1 版本后,kdriver 将在 vCenter 上生成许多 DCUI 登录请求。
从受影响的 ESXi 主机上的 /scratch/log/kdriver.log.* :
2024/08/21 14:39:51.268 - #2 - 4561369/4561352 - HostIPDiscoveryMgr_AO_IMPL: rpEsxInfoScan: /opt/emc/rp/kdriver/bin/rp_rpa_discovery.sh --scan-props & executed successfully2024/08/21 14:40:26.444 - #2 - 4561369/4561352 - HostIPDiscoveryMgr_AO_IMPL: rpEsxInfoScan: /opt/emc/rp/kdriver/bin/rp_rpa_discovery.sh --scan-props & executed successfully
从受影响 ESXi 主机上的 var/log/hostd.log:
2024-08-18T23:32:18.395Z info hostd[2101236] [Originator@6876 sub=Default opID=esxcli_name] Accepted password for user dcui from 127.0.0.12024-08-18T23:32:18.395Z warning hostd[2101236] [Originator@6876 sub=Vimsvc opID=esxcli_name] Refresh function is not configured.User data can't be added to scheduler.User name: dcui2024-08-18T23:32:18.395Z info hostd[2101236] [Originator@6876 sub=Vimsvc.ha-eventmgr opID=esxcli_name] Event 125221 : User dcui@127.0.0.1 logged in as pyvmomi Python/3.8.18 (VMkernel 7.0.3 x86_64)2024-08-18T23:32:18.466Z info hostd[2100837] [Originator@6876 sub=Solo.VmwareCLI opID=esxcli_name user=dcui] Dispatch list2024-08-18T23:32:18.475Z info hostd[2100837] [Originator@6876 sub=Solo.VmwareCLI opID=esxcli_name user=dcui] Dispatch list done
将 RecoverPoint 拆分器安装或升级到 6.0.1.x 版本后,它将在 vCenter 上生成许多直接控制台用户界面 (DCUI) 登录请求。
从受影响的 ESXi 主机上的 /scratch/log/iofilterd-emcsplitter.log :
2024-08-16T08:24:40.578Z In(14) iofilterd-emcsplitter[16847250]: spl_run_cmd: running command 'VI_USERNAME=dcui esxcli system settings advanced list -o "/UserVars/RP_IP_Discovery_8" | grep "\s\s\sString Value:" | awk -F "String Value: " {'print $2'}'
2024-08-16T08:24:41.145Z In(14) iofilterd-emcsplitter[16847250]: spl_run_cmd: running command 'VI_USERNAME=dcui esxcli system settings advanced list -o "/UserVars/RP_IP_Discovery_9" | grep "\s\s\sString Value:" | awk -F "String Value: " {'print $2'}'
2024-08-16T08:24:41.473Z In(14) iofilterd-emcsplitter[16847250]: spl_run_cmd: running command 'VI_USERNAME=dcui esxcli system settings advanced set -o "/UserVars/emcsplitter_clusters" -s ""'
2024-08-16T08:24:41.720Z In(14) iofilterd-emcsplitter[16847250]: spl_run_cmd: running command 'VI_USERNAME=dcui esxcli system settings advanced list -o "/UserVars/RP_IP_Discovery_10" | grep "\s\s\sString Value:" | awk -F "String Value: " {'print $2'}'
从受影响 ESXi 主机上的 var/log/hostd.log:
2024-08-16T08:24:40.538Z In(166) Hostd[2099945]: [Originator@6876 sub=Vimsvc.ha-eventmgr opID=esxcli-ed-6cca sid=52e328a0 user=dcui] Event 2652729 : User dcui@127.0.0.1 logged out (login time: Friday, 16 August, 2024 08:24:40 AM, number of API invocations: 7, user agent: pyvmomi Python/3.8.16 (VMkernel; 8.0.1; x86_64))
2024-08-16T08:24:41.059Z In(166) Hostd[2099964]: [Originator@6876 sub=Vimsvc.HaSessionManager opID=esxcli-hostname sid=5284e077] Accepted password for user dcui from 127.0.0.1 - session=5284e077-ac72-8d89-47b2-38feba5f8354
2024-08-16T08:24:41.059Z Wa(164) Hostd[2099964]: [Originator@6876 sub=Vimsvc opID=esxcli-hostname sid=5284e077] Refresh function is not configured.User data can't be added to scheduler.User name: dcui
2024-08-16T08:24:41.059Z In(166) Hostd[2099964]: [Originator@6876 sub=Vimsvc.ha-eventmgr opID=esxcli-hostname sid=5284e077] Event 2652730 : User dcui@127.0.0.1 logged in as pyvmomi Python/3.8.16 (VMkernel; 8.0.1; x86_64)
2024-08-16T08:24:41.109Z In(166) Hostd[2099943]: [Originator@6876 sub=Solo.VmwareCLI opID=esxcli-8f-6cd7 sid=5284e077 user=dcui] Dispatch system.settings.advanced.list
2024-08-16T08:24:41.111Z In(166) Hostd[2099943]: [Originator@6876 sub=Solo.VmwareCLI opID=esxcli-8f-6cd7 sid=5284e077 user=dcui] Dispatch system.settings.advanced.list done
2024-08-16T08:24:41.114Z In(166) Hostd[2099957]: [Originator@6876 sub=Vimsvc.ha-eventmgr opID=esxcli-8f-6cd8 sid=5284e077 user=dcui] Event 2652731 : User dcui@127.0.0.1 logged out (login time: Friday, 16 August, 2024 08:24:41 AM, number of API invocations: 7, user agent: pyvmomi Python/3.8.16 (VMkernel; 8.0.1; x86_64))
2024-08-16T08:24:41.630Z In(166) Hostd[2099938]: [Originator@6876 sub=Vimsvc.HaSessionManager opID=esxcli-hostname sid=520464cb] Accepted password for user dcui from 127.0.0.1 - session=520464cb-08ef-ad94-d4dd-4d02abaf0937
2024-08-16T08:24:41.630Z Wa(164) Hostd[2099938]: [Originator@6876 sub=Vimsvc opID=esxcli-hostname sid=520464cb] Refresh function is not configured.User data can't be added to scheduler.User name: dcui
此登录和注销调用乘以环境拥有的主机数。它会在 vCenter 上生成多个事件,这可能会填满 /seat 分区,从而导致 vCenter 变得无响应。
Cause
5.3.4.1 版本
在 RecoverPoint 版本 5.3.4.1 中,有一个名为 rp_rpa_discovery.sh 已添加到拆分器/kdriver VIB 中。此脚本旨在按计划检索 ESXi 主机详细信息,默认情况下每 35 秒运行一次。
该脚本使用 DCUI 调用为每个主机收集必要的值,从而为 vCenter 中的每个主机生成频繁的登录和注销请求。在 ESXi 上运行的每个命令都会记录在 vCenter 的数据库中,并且包含数据库 (/seat) 的存储分区可能会变满。这可能会导致 vCenter 行为异常。
此问题的影响取决于 vCenter 上运行的主机数量。主机越多,分区填满的速度就越快,这可能会导致 VXPD 服务崩溃。
此行为会影响运行 版本 7.0.x 的主机。
6.0.1.x 版本
在 RecoverPoint 版本 6.0.1.x 中,RecoverPoint 使用 esxcli 命令和 DCUI 以获取系统信息。这些调用为每个主机收集必要的值,从而为 vCenter 中的每个主机生成频繁的登录和注销请求。在 ESXi 上运行的每个命令都会记录在 vCenter 的数据库中,并且包含数据库 (/seat) 的存储分区可能会变满。这可能会导致 vCenter 行为异常。
与版本 RecoverPoint 5.3.4.1 不同,不再管理每个命令的执行时间。
Resolution
解决方法:
答 — 对于 RecoverPoint for Virtual Machines 版本 5.3.4.1 和 vSphere 7.0.x:
选项 1:
要减少 DCUI 调用次数,请执行以下步骤:
- 打开与 ESXi 的 ssh 会话。
- 执行以下命令。
sed -i 's/t_RpEsxInfoScanInterval = 35000000 # 35 seconds/t_RpEsxInfoScanInterval = 15770000000000 # 6 months As per Dell KB123456 # OLD value is 35000000 # 35 seconds/' /etc/config/emc/rp/kdriver/tweak/tweak.params.splitter
- 验证值是否已更改为 15770000000000 t_RpEsxInfoScanInterval值
cat /etc/config/emc/rp/kdriver/tweak/tweak.params.splitter | grep t_RpEsxInfoScanInterval
- 重新启动拆分器
ps | grep kdriver
pkill -9 kdriver
选项 2:
还有第二个选项可用于执行解决方法,Dell Technologies 可以提供脚本以自动进行更改。
- 请联系 RecoverPoint 支持以获取脚本,有两个选项,一个是用 python 编写的,另一个是用 bash 编写的。脚本名称为 kdriver_scantime_change.sh 或 kdriver_scantime_change.py。
- 将脚本置于受影响 ESXi 主机上的 /tmp 下。
- 运行命令:
chmod +x kdriver_scantime_change.sh
或chmod +x kdriver_scantime_change.py - 现在,使用以下命令运行脚本:
./kdriver_scantime_change.sh
或python kdriver_scantime_change.py
此更改使扫描每 6 个月运行一次,而不是每 35 秒运行一次。此更改不应影响 RecoverPoint 和 ESXi 主机之间的任何通信。
B— 对于 RecoverPoint for Virtual Machines 版本 6.0.1.x 和 vSphere 8.0.x:
Broadcom 要求 vCenter 规模调整必须遵循他们的建议。
https://docs.vmware.com/en/VMware-vSphere/6.5/com.vmware.vsphere.install.doc/GUID-077C7523-E0EA-4922-8D48-C026916323C4.html
如果您必须增加 /seat 分区,请按照 Broadcom 文章中的说明进行作:
https://knowledge.broadcom.com/external/article/316602/increasing-the-disk-space-for-the-vcente.html
如果分区已 100% 使用,请参阅 Broadcom 文章以获取清理说明。
https://knowledge.broadcom.com/external/article/318931/storageseat-disk-100-full-on-vcenter-ser.html
C — 适用于 RecoverPoint for Virtual Machines 版本 5.3.4.1 和 vSphere 8.0.x
此问题已在 RecoverPoint for VMs 拆分器 5.3.4.1.HF2 版本中得到解决。
要确定升级是否适合您的环境,请联系 Dell Technologies 客户支持中心或您的服务代表,并引用此解决方案 ID。