VxRail: LCM z VxRail 7.0.520 lub 7.0.521 przedstawia błąd: pobieranie limitu czasu naprawy obiektów dyskowych vSAN
Summary: Ten artykuł dotyczy niepowodzenia procesu zarządzania cyklem życiowym VxRail (LCM) podczas aktualizacji z wersji 7.0.520 lub 7.0.521. Oferuje rozwiązanie problemu "przekroczenia limitu czasu naprawy obiektów dyskowych vSAN". ...
Symptoms
Na karcie Aktualizacje wtyczki vCenter w interfejsie użytkownika VxRail LCM znajdują się następujące informacje:
Error message: VxRail Update ran into a problem... Failed to retrieve the existing value of the vSAN disk object repair timeout.

W VxRail Manager /var/log/mystic/lcm-web.log Pokazuje:
2024-09-27T15:19:21.429Z <7ff91b9f32f61676bfb7758d9af41713> lcm [ERROR] <94> ComponentUpgradeService.java performComponentUpgrade() (323): Component VMWARE_ESXI upgrade failed due to Failed to retrieve the existing value of the vSAN disk object repair timeout..
2024-09-27T15:19:21.429Z <7ff91b9f32f61676bfb7758d9af41713> lcm [INFO] <94> LCMServiceImpl.java handleUpgradeException() (1812): handling upgrade exception.
2024-09-27T15:19:21.429Z <7ff91b9f32f61676bfb7758d9af41713> lcm [INFO] <94> LCMServiceImpl.java handleUpgradeException() (1817): Error from vc or node upgrade, sync the composite file
...
2024-09-27T15:19:21.467Z <7ff91b9f32f61676bfb7758d9af41713> lcm [ERROR] <94> LCMServiceImpl.java handleUpgradeException() (1855): failed to upgrade: VXRAIL_COMPOSITE-7.0.531-28777448_for_7.0.x.zip,
with exception:
com.vce.lcm.exception.LCMInternalException: Failed to retrieve the existing value of the vSAN disk object repair timeout.
at com.vce.lcm.core.upgrade.ComponentUpgradeService.performComponentUpgrade(ComponentUpgradeService.java:336)
at com.vce.lcm.api.LCMServiceImpl.performBatchUpgrade(LCMServiceImpl.java:2152)
...
024-09-27T15:19:21.514Z <7ff91b9f32f61676bfb7758d9af41713> lcm [INFO] <94> VirtualApplianceUpgradeParameterStatusHandler.java notifyError() (102): Notify errors for upgrade bundle UpgradeBundleProfile{name='VXRAIL_COMPOSITE-7.0.531-28777448_for_7.0.x.zip', description='null', sizeInKBytes='15664544', bundleFileName='VXRAIL_COMPOSITE-7.0.531-28777448_for_7.0.x.zip', version='7.0.531', build='28777448', targetHardwareInfo='', targetModelInfo='com.vce.commons.vcm.state.CompositeManifestFile$TargetModelInfo@3901ec9', replaceTargetInfo='com.vce.commons.vcm.state.CompositeManifestFile$ReplaceTargetInfo@16a5c26c', targetNicModelInfo='com.vce.commons.vcm.state.CompositeManifestFile$TargetNicModelInfo@2949e0b9', removeUpgradeVIB='false', forceInstall='false', skipList='[]', upgradeTime='0', rebootFlag='false', isUpgradeComponent='false', totalEstimated='100668', totalUsed='54511', minimumVxRailVersion='7.0.010', patchType=''}, upgradeStep UPGRADE, upgradeTarget UpgradeTarget{ComponentType=VXRAIL_COMPOSITE, name='esxxxx.domain.country', isPipelineTask='false'}, action Retrieve the value of the vSAN disk object repair timeout., message Failed to retrieve the existing value of the vSAN disk object repair timeout.
Dodatkowe szczegółowe informacje o błędzie pomagają zidentyfikować hosta, którego dotyczy problem, oraz dodatkowy objaw Zbyt wiele zaległych operacji:
2024-09-27T15:18:29.011Z <7ff91b9f32f61676bfb7758d9af41713> lcm [INFO] <374> BatchUpgrade.java updateVsanClomTimeoutValueBeforeUpgrade() (881): Obtaining the existing vSAN Clom timeout value for th
e host : esxxxx.domain.country
...
2024-09-27T15:18:33.070Z <7ff91b9f32f61676bfb7758d9af41713> lcm [WARN] <374> ScriptServiceImpl.java runLocalScript() (507): [/etc/vmware-marvin/scripts/lcm/scripts/update-vsan-clom-repair-timeout.p
y@localhost]: <stderr> Traceback (most recent call last):
File "/usr/lib/vmware-marvin/marvind/temp/3741351928508979296.tmp", line 154, in <module>
main()
File "/usr/lib/vmware-marvin/marvind/temp/3741351928508979296.tmp", line 149, in main
get_timeout_value(options)
File "/usr/lib/vmware-marvin/marvind/temp/3741351928508979296.tmp", line 133, in get_timeout_value
result = advanced_sys_settings.List(False, VSAN_PROPERTY)
^^^^^^^^^^^^^^^^^^^^^^^^^^^^^^^^^^^^^^^^^^^^^^^^
File "/usr/lib/python3.11/site-packages/pyVmomi/VmomiSupport.py", line 706, in <lambda>
self.f(*(self.args + (obj,) + args), **kwargs)
File "/usr/lib/python3.11/site-packages/pyVmomi/VmomiSupport.py", line 512, in _InvokeMethod
return self._stub.InvokeMethod(self, info, args)
^^^^^^^^^^^^^^^^^^^^^^^^^^^^^^^^^^^^^^^^^
File "/usr/lib/python3.11/site-packages/pyVmomi/ManagedMethodExecutorHelper.py", line 74, in InvokeMethod
result = self.mme.ExecuteSoap(moid=moid,
^^^^^^^^^^^^^^^^^^^^^^^^^^^^^^^
File "/usr/lib/python3.11/site-packages/pyVmomi/VmomiSupport.py", line 706, in <lambda>
self.f(*(self.args + (obj,) + args), **kwargs)
File "/usr/lib/python3.11/site-packages/pyVmomi/VmomiSupport.py", line 512, in _InvokeMethod
return self._stub.InvokeMethod(self, info, args)
^^^^^^^^^^^^^^^^^^^^^^^^^^^^^^^^^^^^^^^^^
File "/usr/lib/python3.11/site-packages/pyVmomi/SoapAdapter.py", line 1397, in InvokeMethod
raise obj # pylint: disable-msg=E0702
^^^^^^^^^
pyVmomi.VmomiSupport.vmodl.fault.SystemError: (vmodl.fault.SystemError) {
dynamicType = <unset>,
dynamicProperty = (vmodl.DynamicProperty) [],
msg = 'A general system error occurred: Too many outstanding operations',
faultCause = <unset>,
faultMessage = (vmodl.LocalizableMessage) [],
reason = 'Too many outstanding operations'
}Cause
Problem z kodem w VxRail w wersji 7.0.520 i 7.0.521 powoduje esxcli host, aby z czasem utknąć. Zapytanie w dziennikach zwraca:
reason = 'Too many outstanding operations'
Powoduje to błąd LCM, proces uaktualnienia nie może pobrać wartości konfiguracji vSAN za pośrednictwem esxcli.
Resolution
Trwała poprawka tego problemu znajduje się w VxRail w wersji 7.0.531. Informacje dotyczące wydania znajdują się na stronie Informacje dotyczące wydania Dell VxRail 7.0.x | Dell US (wymagane logowanie klienta)
Użytkownik musi ponownie uruchomić hostd management service w węźle, który uległ awarii przed ponownym uruchomieniem skryptu aktualizacji LCM VxRail. Usuwa zaległe żądania i umożliwia kontynuowanie uaktualnienia.
/etc/init.d/hostd restart
Aby uzyskać wskazówki dotyczące ponownego uruchamiania ESXi hostd servicezapoznaj się z artykułem firmy Broadcom Ponowne uruchamianie agentów zarządzania w oprogramowaniu ESXi.
Jeśli wymagana jest pomoc w przejrzeniu dzienników, zidentyfikowaniu hosta, którego dotyczy problem, lub ponownym uruchomieniu usługi, skontaktuj się z Dell Support.
Additional Information
Jeśli zastosowano funkcję STIG , zapoznaj się z artykułem VxRail: Nieprawidłowe uprawnienia do plików dla niektórych bibliotek podczas aktualizacji do wersji 7.0.400 przy użyciu STIG, jako potencjalna przyczyna tego błędu