VxRail:升级在 VSAN 磁盘格式升级时失败 (000528930)

无评分
MOD
MOD

VxRail:升级在 VSAN 磁盘格式升级时失败 (000528930)

知识库文章:000528930

VxRail:升级在 VSAN 磁盘格式升级时失败 (000528930)

主要产品:VxRail 一体机系列

产品:VxRail 一体机系列


版本:2

文章类型:中断修复

目标受众:级别 30 = 客户

上次发布时间:2019 年 2 月 4 日(星期一),03:13:11 GMT

 

总结:

 

 

问题:

问题:
VxRail 升级在 VSAN 磁盘格式升级时失败。
在 vCenter Web 客户端中,可以观察到 VSAN 磁盘格式化升级在 10% 处卡住

分析:
如果转到 RVC 并检查磁盘状态,则会发现它已在磁盘级别进行了升级,如下所示:
Run vsan.disks_stats ~/computers/cluster-name
+----------------------+--------------------------------+----------+------+------------+---------+----------+-------------+----------+----------+-------------+---------+----------+---------+
|                      |                                |          | Num  | Capacity   |         |          | Physical    | Physical | Physical | Logical     | Logical | Logical  | Status  |
| DisplayName          | Host                           | DiskTier | Comp | Total      | Used    | Reserved | Capacity    | Used     | Reserved | Capacity    | Used    | Reserved | Health  |
+----------------------+--------------------------------+----------+------+------------+---------+----------+-------------+----------+----------+-------------+---------+----------+---------+
| naa.50000397cc8ac2d5 | kc-rail-holodeck-01.it.unr.edu | Cache    | 0    | 372.61 GB  | 0.00 %  | 0.00 %   | N/A         | N/A      | N/A      | N/A         | N/A     | N/A      | OK (v5) |
| naa.5002538a17332f80 | kc-rail-holodeck-01.it.unr.edu | Capacity | 122  | 3387.72 GB | 33.28 % | 22.12 %  | 10163.17 GB | 33.32 %  | 17.74 %  | 16383.99 GB | 10.97 % | 4.57 %   | OK (v5) |
| naa.5002538a17334b20 | kc-rail-holodeck-01.it.unr.edu | Capacity | 122  | 3387.72 GB | 33.28 % | 14.45 %  | 10163.17 GB | 33.32 %  | 17.74 %  | 16383.99 GB | 7.54 %  | 2.99 %   | OK (v5) |
| naa.5002538a173337f0 | kc-rail-holodeck-01.it.unr.edu | Capacity | 122  | 3387.72 GB | 33.28 % | 16.65 %  | 10163.17 GB | 33.32 %  | 17.74 %  | 16383.99 GB | 11.12 % | 3.44 %   | OK (v5) |
+----------------------+--------------------------------+----------+------+------------+---------+----------+-------------+----------+----------+-------------+---------+----------+---------+
But the object level is not upgraded as following:
Run vsan.obj_status_report ~/computers/cluster-name
+-------------------------------------+------------------------------+
| Num Healthy Comps / Total Num Comps | Num objects with such status |
+-------------------------------------+------------------------------+
+-------------------------------------+------------------------------+
Total orphans: 0

Total v1 objects: 0
Total v2 objects: 0
Total v2.5 objects: 0
Total v3 objects: 724
Total v5 objects: 0
Total v6 objects: 0
Total v7 objects: 0

如果此时重试了 VxRail 升级,则升级会成功,因为磁盘级别已更新,下次尝试时会跳过 VSAN 磁盘格式升级。
但对象级别不会进行升级。

应找到以下日志消息 /storage/log/vmware/vsan-health/vmware-vsan-health-service.log on VCSA
  File "/usr/lib/vmware-vpx/vsan-health/pyMoVsan/VsanPyVmomiProfiler.py", line 152, in InvokeMethod
    return self._stub.InvokeMethod(mo, info, args)
  File "/usr/lib/vmware/site-packages/pyVmomi/SoapAdapter.py", line 1668, in InvokeMethod
    raise obj
pyVmomi.VmomiSupport.vim.fault.VsanFault: (vim.fault.VsanFault) {
   dynamicType = <unset>,
   dynamicProperty = (vmodl.DynamicProperty) [],
   msg = '',
   faultCause = <unset>,
   faultMessage = (vmodl.LocalizableMessage) [
      (vmodl.LocalizableMessage) {
         dynamicType = <unset>,
         dynamicProperty = (vmodl.DynamicProperty) [],
         key = 'com.vmware.vsan.diskconversion.msg.bumpupversionerror',
         arg = (vmodl.KeyAnyValue) [],
         message = 'Failed to bump up format version for diskmapping naa.50000397cc8aa6dd, Failed to get VsanInfo operation lock for diskOpLockan operation is currently in progress(locked pid: 0), error: /tmp/.vsanDiskOpLock.lock.LOCK: timout waiting for lock after 30 seconds. Lock is currently held by process 438633 (python: python /usr/lib/vmware/vsan/perfsvc/vsanperfsvc.pyc)'
      }

 

 

原因:

在 6.7 vSAN VC 服务中,我们通过并行方式对每个磁盘组升级 vSAN 磁盘格式版本。
VC 了解 V6,但主机仅了解 V5,因为它们是 ESXi 6.5

升级 vSAN 磁盘组时,必须保持磁盘操作锁,如果无法在 30 秒内获取此锁,则升级请求会失败。
因此,如果 vSAN 主机有多个磁盘组要升级,则在获取此锁时一定会出现冲突,如果磁盘组升级超过 30 秒,则此主机上的其他磁盘组请求会失败。
风险/影响:V5 的完整功能将不可用,但是对象会处于 V3 上,不会对数据产生潜在风险。

 

解决方案:

这是 VC 6.5 中的已知问题,将在 6.7U2 中得到修复。

此问题存在解决方案,但需要 EMC 技术支持人员的干预。因为这是 vCenter 6.5 中的错误,所以 EMC 支持可能需要与 VMware 接洽。
请联系 EMC 客户支持中心或您的服务代表,以便获取技术帮助并告知此解决方案 ID。

 

主要产品:

VxRail 应用装置系列

 

产品:

VxRail 应用装置系列

 

 

版本历史
修订号
1 / 1
上次更新时间:
‎09-28-2020 02:18 PM
更新依据:
 
贡献者