RecoverPoint for VMs: O divisor nas versões 5.3.4.1 e 6.0.1.x gera solicitações de login da DCUI
Summary: Depois de fazer upgrade do VIB do divisor para a versão 5.3.4.1 ou depois de instalar a versão 6.0.1.x, o processo do divisor gerará muitas solicitações de log-in da DCUI no vCenter.
Symptoms
Depois de fazer upgrade do VIB do RecoverPoint Splitter/Kdriver para a versão 5.3.4.1, o kdriver gerará muitas solicitações de log-in da DCUI no vCenter.
A partir de /scratch/log/kdriver.log.* no host do ESXi afetado:
2024/08/21 14:39:51.268 - #2 - 4561369/4561352 - HostIPDiscoveryMgr_AO_IMPL: rpEsxInfoScan: /opt/emc/rp/kdriver/bin/rp_rpa_discovery.sh --scan-props & executed successfully2024/08/21 14:40:26.444 - #2 - 4561369/4561352 - HostIPDiscoveryMgr_AO_IMPL: rpEsxInfoScan: /opt/emc/rp/kdriver/bin/rp_rpa_discovery.sh --scan-props & executed successfully
Em var/log/hostd.log no host do ESXi afetado:
2024-08-18T23:32:18.395Z info hostd[2101236] [Originator@6876 sub=Default opID=esxcli_name] Accepted password for user dcui from 127.0.0.12024-08-18T23:32:18.395Z warning hostd[2101236] [Originator@6876 sub=Vimsvc opID=esxcli_name] Refresh function is not configured.User data can't be added to scheduler.User name: dcui2024-08-18T23:32:18.395Z info hostd[2101236] [Originator@6876 sub=Vimsvc.ha-eventmgr opID=esxcli_name] Event 125221 : User dcui@127.0.0.1 logged in as pyvmomi Python/3.8.18 (VMkernel 7.0.3 x86_64)2024-08-18T23:32:18.466Z info hostd[2100837] [Originator@6876 sub=Solo.VmwareCLI opID=esxcli_name user=dcui] Dispatch list2024-08-18T23:32:18.475Z info hostd[2100837] [Originator@6876 sub=Solo.VmwareCLI opID=esxcli_name user=dcui] Dispatch list done
Depois de instalar ou fazer upgrade do divisor do RecoverPoint para a versão 6.0.1.x, ele gerará muitas solicitações de log-in da interface do usuário do console direto (DCUI) no vCenter.
De /scratch/log/iofilterd-emcsplitter.log no host do ESXi afetado:
2024-08-16T08:24:40.578Z In(14) iofilterd-emcsplitter[16847250]: spl_run_cmd: running command 'VI_USERNAME=dcui esxcli system settings advanced list -o "/UserVars/RP_IP_Discovery_8" | grep "\s\s\sString Value:" | awk -F "String Value: " {'print $2'}'
2024-08-16T08:24:41.145Z In(14) iofilterd-emcsplitter[16847250]: spl_run_cmd: running command 'VI_USERNAME=dcui esxcli system settings advanced list -o "/UserVars/RP_IP_Discovery_9" | grep "\s\s\sString Value:" | awk -F "String Value: " {'print $2'}'
2024-08-16T08:24:41.473Z In(14) iofilterd-emcsplitter[16847250]: spl_run_cmd: running command 'VI_USERNAME=dcui esxcli system settings advanced set -o "/UserVars/emcsplitter_clusters" -s ""'
2024-08-16T08:24:41.720Z In(14) iofilterd-emcsplitter[16847250]: spl_run_cmd: running command 'VI_USERNAME=dcui esxcli system settings advanced list -o "/UserVars/RP_IP_Discovery_10" | grep "\s\s\sString Value:" | awk -F "String Value: " {'print $2'}'
Em var/log/hostd.log no host do ESXi afetado:
2024-08-16T08:24:40.538Z In(166) Hostd[2099945]: [Originator@6876 sub=Vimsvc.ha-eventmgr opID=esxcli-ed-6cca sid=52e328a0 user=dcui] Event 2652729 : User dcui@127.0.0.1 logged out (login time: Friday, 16 August, 2024 08:24:40 AM, number of API invocations: 7, user agent: pyvmomi Python/3.8.16 (VMkernel; 8.0.1; x86_64))
2024-08-16T08:24:41.059Z In(166) Hostd[2099964]: [Originator@6876 sub=Vimsvc.HaSessionManager opID=esxcli-hostname sid=5284e077] Accepted password for user dcui from 127.0.0.1 - session=5284e077-ac72-8d89-47b2-38feba5f8354
2024-08-16T08:24:41.059Z Wa(164) Hostd[2099964]: [Originator@6876 sub=Vimsvc opID=esxcli-hostname sid=5284e077] Refresh function is not configured.User data can't be added to scheduler.User name: dcui
2024-08-16T08:24:41.059Z In(166) Hostd[2099964]: [Originator@6876 sub=Vimsvc.ha-eventmgr opID=esxcli-hostname sid=5284e077] Event 2652730 : User dcui@127.0.0.1 logged in as pyvmomi Python/3.8.16 (VMkernel; 8.0.1; x86_64)
2024-08-16T08:24:41.109Z In(166) Hostd[2099943]: [Originator@6876 sub=Solo.VmwareCLI opID=esxcli-8f-6cd7 sid=5284e077 user=dcui] Dispatch system.settings.advanced.list
2024-08-16T08:24:41.111Z In(166) Hostd[2099943]: [Originator@6876 sub=Solo.VmwareCLI opID=esxcli-8f-6cd7 sid=5284e077 user=dcui] Dispatch system.settings.advanced.list done
2024-08-16T08:24:41.114Z In(166) Hostd[2099957]: [Originator@6876 sub=Vimsvc.ha-eventmgr opID=esxcli-8f-6cd8 sid=5284e077 user=dcui] Event 2652731 : User dcui@127.0.0.1 logged out (login time: Friday, 16 August, 2024 08:24:41 AM, number of API invocations: 7, user agent: pyvmomi Python/3.8.16 (VMkernel; 8.0.1; x86_64))
2024-08-16T08:24:41.630Z In(166) Hostd[2099938]: [Originator@6876 sub=Vimsvc.HaSessionManager opID=esxcli-hostname sid=520464cb] Accepted password for user dcui from 127.0.0.1 - session=520464cb-08ef-ad94-d4dd-4d02abaf0937
2024-08-16T08:24:41.630Z Wa(164) Hostd[2099938]: [Originator@6876 sub=Vimsvc opID=esxcli-hostname sid=520464cb] Refresh function is not configured.User data can't be added to scheduler.User name: dcui
Essas chamadas de log-in e log-out são multiplicadas pelo número de hosts que o ambiente possui. Ela gera vários eventos no vCenter, o que pode encher a partição /seat, fazendo com que o vCenter pare de responder.
Cause
Versão
5.3.4.1No RecoverPoint versão 5.3.4.1, um novo script chamado rp_rpa_discovery.sh foi adicionado ao VIB do divisor/kdriver. Esse script foi projetado para recuperar detalhes do host do ESXi de forma agendada, sendo executado a cada 35 segundos por padrão.
O script usa chamadas DCUI para coletar os valores necessários para cada host, gerando solicitações frequentes de log-in e log-out para cada host no vCenter. Cada comando executado no ESXi é registrado no banco de dados do vCenter, e a partição de armazenamento que contém o banco de dados (/seat) pode ficar cheia. Isso pode fazer com que o vCenter se comporte de forma anormal.
O impacto desse problema depende do número de hosts em execução no vCenter. Quanto mais hosts houver, mais rapidamente a partição poderá ser preenchida, possivelmente causando travamento do serviço VXPD.
Esse comportamento afeta hosts que executam a versão 7.0.x.
Versão
6.0.1.xNo RecoverPoint versão 6.0.1.x, o RecoverPoint usa o comando esxcli com DCUI para buscar informações do sistema. Essas chamadas devem coletar os valores necessários para cada host, gerando solicitações frequentes de log-in e log-out para cada host no vCenter. Cada comando executado no ESXi é registrado no banco de dados do vCenter, e a partição de armazenamento que contém o banco de dados (/seat) pode ficar cheia. Isso pode fazer com que o vCenter se comporte de forma anormal.
Ao contrário da versão 5.3.4.1 do RecoverPoint, não é mais possível gerenciar o tempo de execução de cada comando.
Resolution
Solução temporária:
A - Para o RecoverPoint for Virtual Machines versão 5.3.4.1 e vSphere 7.0.x:
Opção 1:
Para reduzir o número de chamadas DCUI, execute as seguintes etapas:
- Abra a sessão SSH para o ESXi.
- Execute o comando abaixo.
sed -i 's/t_RpEsxInfoScanInterval = 35000000 # 35 seconds/t_RpEsxInfoScanInterval = 15770000000000 # 6 months As per Dell KB123456 # OLD value is 35000000 # 35 seconds/' /etc/config/emc/rp/kdriver/tweak/tweak.params.splitter
- Valide se o valor foi alterado para t_RpEsxInfoScanInterval valor para 15770000000000
cat /etc/config/emc/rp/kdriver/tweak/tweak.params.splitter | grep t_RpEsxInfoScanInterval
- Reinicie o divisor
ps | grep kdriver
pkill -9 kdriver
Opção 2:
Há uma segunda opção para executar a solução temporária. A Dell Technologies pode fornecer um script para fazer as alterações automaticamente.
- Entre em contato com o suporte do RecoverPoint para obter o script, há duas opções: uma é gravada em Python e outra em bash. O nome do script é kdriver_scantime_change.sh ou kdriver_scantime_change.py.
- Coloque o script em /tmp no host do ESXi afetado.
- Comando de execução:
chmod +x kdriver_scantime_change.sh
Ouchmod +x kdriver_scantime_change.py - Agora execute o script com o comando:
./kdriver_scantime_change.sh
Oupython kdriver_scantime_change.py
A alteração faz com que a varredura seja executada a cada 6 meses, em vez de executar a cada 35 segundos. Essa alteração não deve afetar nenhuma comunicação entre o RecoverPoint e os hosts do ESXi.
B - Para o RecoverPoint for Virtual Machines versão 6.0.1.x e vSphere 8.0.x:
A Broadcom solicita que o dimensionamento do vCenter siga suas recomendações.
https://docs.vmware.com/en/VMware-vSphere/6.5/com.vmware.vsphere.install.doc/GUID-077C7523-E0EA-4922-8D48-C026916323C4.html
Se você precisar aumentar a partição /seat, siga as instruções no artigo da Broadcom:
https://knowledge.broadcom.com/external/article/316602/increasing-the-disk-space-for-the-vcente.html
Se a partição for 100% usada, consulte o artigo da Broadcom para obter instruções de limpeza.
https://knowledge.broadcom.com/external/article/318931/storageseat-disk-100-full-on-vcenter-ser.html
C - Para o RecoverPoint for Virtual Machines versão 5.3.4.1 e vSphere 8.0.x
Esse problema foi resolvido na versão 5.3.4.1.HF2 do divisor do RecoverPoint for VMs.
Para determinar se um upgrade é adequado para seu ambiente, entre em contato com o Centro de suporte ao cliente da Dell Technologies ou com seu representante de serviço e consulte o ID dessa solução.