VxRail: VxRail 7.0.520 또는 7.0.521의 LCM에 vSAN 디스크 오브젝트 복구 시간 초과 검색 오류 표시
Summary: 이 문서에서는 버전 7.0.520 또는 7.0.521에서 업그레이드할 때 VxRail LCM(Life-Cycle Management) 프로세스가 실패하는 문제를 다룹니다. "vSAN 디스크 오브젝트 복구 시간 초과" 문제에 대한 솔루션을 제공합니다.
Symptoms
VxRail LCM 사용자 인터페이스 vCenter 플러그인 업데이트 탭에는 다음이 표시됩니다.
Error message: VxRail Update ran into a problem... Failed to retrieve the existing value of the vSAN disk object repair timeout.

VxRail Manager에서 /var/log/mystic/lcm-web.log 보여 줍니다:
2024-09-27T15:19:21.429Z <7ff91b9f32f61676bfb7758d9af41713> lcm [ERROR] <94> ComponentUpgradeService.java performComponentUpgrade() (323): Component VMWARE_ESXI upgrade failed due to Failed to retrieve the existing value of the vSAN disk object repair timeout..
2024-09-27T15:19:21.429Z <7ff91b9f32f61676bfb7758d9af41713> lcm [INFO] <94> LCMServiceImpl.java handleUpgradeException() (1812): handling upgrade exception.
2024-09-27T15:19:21.429Z <7ff91b9f32f61676bfb7758d9af41713> lcm [INFO] <94> LCMServiceImpl.java handleUpgradeException() (1817): Error from vc or node upgrade, sync the composite file
...
2024-09-27T15:19:21.467Z <7ff91b9f32f61676bfb7758d9af41713> lcm [ERROR] <94> LCMServiceImpl.java handleUpgradeException() (1855): failed to upgrade: VXRAIL_COMPOSITE-7.0.531-28777448_for_7.0.x.zip,
with exception:
com.vce.lcm.exception.LCMInternalException: Failed to retrieve the existing value of the vSAN disk object repair timeout.
at com.vce.lcm.core.upgrade.ComponentUpgradeService.performComponentUpgrade(ComponentUpgradeService.java:336)
at com.vce.lcm.api.LCMServiceImpl.performBatchUpgrade(LCMServiceImpl.java:2152)
...
024-09-27T15:19:21.514Z <7ff91b9f32f61676bfb7758d9af41713> lcm [INFO] <94> VirtualApplianceUpgradeParameterStatusHandler.java notifyError() (102): Notify errors for upgrade bundle UpgradeBundleProfile{name='VXRAIL_COMPOSITE-7.0.531-28777448_for_7.0.x.zip', description='null', sizeInKBytes='15664544', bundleFileName='VXRAIL_COMPOSITE-7.0.531-28777448_for_7.0.x.zip', version='7.0.531', build='28777448', targetHardwareInfo='', targetModelInfo='com.vce.commons.vcm.state.CompositeManifestFile$TargetModelInfo@3901ec9', replaceTargetInfo='com.vce.commons.vcm.state.CompositeManifestFile$ReplaceTargetInfo@16a5c26c', targetNicModelInfo='com.vce.commons.vcm.state.CompositeManifestFile$TargetNicModelInfo@2949e0b9', removeUpgradeVIB='false', forceInstall='false', skipList='[]', upgradeTime='0', rebootFlag='false', isUpgradeComponent='false', totalEstimated='100668', totalUsed='54511', minimumVxRailVersion='7.0.010', patchType=''}, upgradeStep UPGRADE, upgradeTarget UpgradeTarget{ComponentType=VXRAIL_COMPOSITE, name='esxxxx.domain.country', isPipelineTask='false'}, action Retrieve the value of the vSAN disk object repair timeout., message Failed to retrieve the existing value of the vSAN disk object repair timeout.
추가 오류 세부 정보는 영향을 받는 호스트와 추가 증상을 식별하는 데 도움이 됩니다. 미해결 작업이 너무 많음:
2024-09-27T15:18:29.011Z <7ff91b9f32f61676bfb7758d9af41713> lcm [INFO] <374> BatchUpgrade.java updateVsanClomTimeoutValueBeforeUpgrade() (881): Obtaining the existing vSAN Clom timeout value for th
e host : esxxxx.domain.country
...
2024-09-27T15:18:33.070Z <7ff91b9f32f61676bfb7758d9af41713> lcm [WARN] <374> ScriptServiceImpl.java runLocalScript() (507): [/etc/vmware-marvin/scripts/lcm/scripts/update-vsan-clom-repair-timeout.p
y@localhost]: <stderr> Traceback (most recent call last):
File "/usr/lib/vmware-marvin/marvind/temp/3741351928508979296.tmp", line 154, in <module>
main()
File "/usr/lib/vmware-marvin/marvind/temp/3741351928508979296.tmp", line 149, in main
get_timeout_value(options)
File "/usr/lib/vmware-marvin/marvind/temp/3741351928508979296.tmp", line 133, in get_timeout_value
result = advanced_sys_settings.List(False, VSAN_PROPERTY)
^^^^^^^^^^^^^^^^^^^^^^^^^^^^^^^^^^^^^^^^^^^^^^^^
File "/usr/lib/python3.11/site-packages/pyVmomi/VmomiSupport.py", line 706, in <lambda>
self.f(*(self.args + (obj,) + args), **kwargs)
File "/usr/lib/python3.11/site-packages/pyVmomi/VmomiSupport.py", line 512, in _InvokeMethod
return self._stub.InvokeMethod(self, info, args)
^^^^^^^^^^^^^^^^^^^^^^^^^^^^^^^^^^^^^^^^^
File "/usr/lib/python3.11/site-packages/pyVmomi/ManagedMethodExecutorHelper.py", line 74, in InvokeMethod
result = self.mme.ExecuteSoap(moid=moid,
^^^^^^^^^^^^^^^^^^^^^^^^^^^^^^^
File "/usr/lib/python3.11/site-packages/pyVmomi/VmomiSupport.py", line 706, in <lambda>
self.f(*(self.args + (obj,) + args), **kwargs)
File "/usr/lib/python3.11/site-packages/pyVmomi/VmomiSupport.py", line 512, in _InvokeMethod
return self._stub.InvokeMethod(self, info, args)
^^^^^^^^^^^^^^^^^^^^^^^^^^^^^^^^^^^^^^^^^
File "/usr/lib/python3.11/site-packages/pyVmomi/SoapAdapter.py", line 1397, in InvokeMethod
raise obj # pylint: disable-msg=E0702
^^^^^^^^^
pyVmomi.VmomiSupport.vmodl.fault.SystemError: (vmodl.fault.SystemError) {
dynamicType = <unset>,
dynamicProperty = (vmodl.DynamicProperty) [],
msg = 'A general system error occurred: Too many outstanding operations',
faultCause = <unset>,
faultMessage = (vmodl.LocalizableMessage) [],
reason = 'Too many outstanding operations'
}Cause
VxRail 릴리스 7.0.520 및 7.0.521의 코드 문제로 인해 esxcli host 명령을 사용하여 시간이 지남에 따라 중단될 수 있습니다. 로그의 쿼리는 다음을 반환합니다.
reason = 'Too many outstanding operations'
이로 인해 LCM이 실패하고 업그레이드 프로세스가 다음을 통해 VSAN 구성 값을 검색하지 못합니다. esxcli.
Resolution
이 문제에 대한 영구 수정 사항은 VxRail 릴리스 7.0.531에 있습니다. 릴리스 노트는 Dell VxRail 7.0.x 릴리스 노트 | Dell 미국 (고객 로그인 필요)
사용자는 hostd management service VxRail LCM 업그레이드 스크립트를 재시작하기 전에 장애가 발생한 노드에서 이렇게 하면 미해결 요청이 지워지고 업그레이드를 계속할 수 있습니다.
/etc/init.d/hostd restart
재시작에 대한 지침은 ESXi hostd service, Broadcom 문서 ESXi에서 관리 에이전트 재시작을 참조하십시오.
도움이 필요한 경우 로그를 검토하거나 영향을 받는 호스트를 식별하거나 서비스를 재시작합니다.
Additional Information
STIG가 적용된 경우 VxRail: 문서를 검토하십시오. STIG를 사용하여 7.0.400으로 업그레이드하는 동안 일부 라이브러리에 대한 잘못된 파일 사용 권한이 이 오류의 잠재적 원인으로 표시됨