考虑事项
应尽可能按照 Solve 流程更换磁盘。授权方可以从
SolVe Online Portal 访问这些程序。
使用 vCenter Web Client 手动更换驱动器的步骤通常可见。手动更新 VXRM 数据库的步骤仅对 Dell EMC 员工和合作伙伴可见。
对于客户,现场支持等需要有关作为客户可更换部件 (CRU) 发运的更换磁盘的帮助,当 VxRail Manager 的硬件更换选项出现故障或不可用时,请使用 VxRail 远程支持打开 SR 并参考本文。建议的 SR 为严重性 2 或 3,设置为“硬件”类型。正确的 SR 摘要可能是:“VxRail 驱动器更换,需要 VxRail 支持的协助”。
步骤1.识别故障磁盘:
如何在未知时识别故障磁盘的物理插槽(例如,当 vCenter 将磁盘标记为故障但 iDRAC/VxRail Manager 未出现故障时)。
您可以使用 vCenter Client 识别故障磁盘。
- 单击 hosts and clusters 视图。
- 单击左侧窗格中的 群集级别 。
- 单击 Configure (Manage in older versions) -> vSAN -> Disk Management 。
- 在 磁盘组 面板中,找到具有故障磁盘的磁盘组,然后 单击磁盘组 以在下面的 磁盘组磁盘 部分中显示各个磁盘。
- 有两种不同的选项可用于识别和或确认出现故障的磁盘:
- 通过 LED 闪烁识别:
- 单击“Disk Group Disks”部分中的故障磁盘。
- 然后单击三个点 (...),然后选择 Turn on LED 。
-
通过 naa 进行标识。数量:
提醒:故障磁盘通常显示 vSAN UUID 而不是 naa。
- 您可以使用 SSH 访问主机以通过与 vSAN UUID 匹配来尝试获取。通过与 vSAN UUID 匹配的磁盘数量:
-
# vdq -qH
显示 naa。# 和 vSAN UUID 可以:
-
# esxcli vsan storage list
显示 naa。#、vSAN UUID 和磁盘组的 UUID(如果可以):
- 如果两者都无法显示关联的 vSAN UUID 的 naa. 编号,# 对于关联的 vSAN UUID,您可以使用下面的方法来确定 naa。的磁盘使用 消除过程。
- 查看磁盘组中其他磁盘的 naa. 编号,记下编号的最后 4-6 个数字。如果主机上有多个磁盘组,请对所有磁盘组执行此操作。
- 在 VxRail Manager 的主机物理视图中,将 vCenter 中的 naa. 编号与 VxRail Manager 中的 GUID 编号关联。
- 搜索直至找到具有不在列表中的 naa.编号的磁盘。这就是故障磁盘。
步骤 2.移除磁盘或磁盘组:
预检查:最佳实践是,在执行此类维护之前,确保包括服务虚拟机在内的所有虚拟机 (VM) 都有最新的备份(在群集外)。在开始前,群集应处于良好运行状况(与要更换的故障驱动器相关的警报除外)。如果没有需要更正的一个或多个磁盘组,则 vSAN 没有足够的剩余空间用于完整功能,
则不得执行 此过程。
- 在 vCenter Web 客户端的“主机和群集”视图中,使用 “确保可访问性”将主机置于维护模式。右键单击主机,然后单击 进入维护模式 。
- 选择群集并导航到 Configure(或较旧版本中的“Manage”)> Settings > Disk Management 。(在这里删除旧磁盘。)
-
如何从磁盘组中删除磁盘:
- 在 磁盘组 面板中,滚动到正确的主机,然后选择具有故障磁盘的磁 盘组 。
- 在主机列表上方有一个 View Disks 按钮。
- 打开包含受影响驱动器的磁盘组下的驱动器列表,然后选择它。
- 单击驱动器列表上方的 Remove disk 按钮。将显示一个窗口,其中包含“full data migration”、“Ensure Accessibility”和“no data migration”(措辞取决于版本)选项。主机应已处于维护模式,并且具有上述步骤 1 中的“确保可访问性”,因此整个主机上的所有虚拟机对象数据都应具有拷贝或存在于群集中的其他地方。为此部分选择“No Data Migration”。然后单击 Remove 。
- 等待“Remove disks from use by Virtual San”任务完成。导航至 Monitor > Tasks (监视>任务 )以查看进度。
-
如何删除整个磁盘组:
如果故障驱动器是高速缓存层驱动器,则必须删除并重新创建磁盘组。
- 在“Disk Groups”面板中,滚动到正确的主机,然后选择包含故障磁盘的磁盘组。
- 选择正确的磁盘组,然后单击它前面的三个点。
- 在“Menu”(菜单)上,单击 Remove (删除)。将显示一个窗口,其中包含“full data migration”、“Ensure Accessibility”和“no data migration”(措辞取决于版本)选项。主机应已处于维护模式,并且具有上述步骤 1 中的“确保可访问性”,因此整个主机上的所有虚拟机对象数据都应具有拷贝或存在于群集中的其他地方。为此部分选择“No Data Migration”。然后单击 Remove 。
- 等待“Remove disks from use by Virtual San”任务完成。导航至 Monitor > Tasks (监视>任务 )以查看进度。
步骤 3.以物理方式更换出现故障的磁盘:
解决程序包含有关安全预防措施以及如何执行此步骤的信息。您必须将托架与故障磁盘分离,并将更换磁盘放入其中,因为更换驱动器通常不随托架一起提供。对于此步骤,主机应该仍处于维护模式,以避免在可能出现 I/O 流量时意外删除错误的驱动器。要进一步降低风险,请在物理更换驱动器之前关闭主机电源,但这不是必要的。
步骤4.将新磁盘标记为本地:
- 在导航器中选择主机,然后导航到 Manage > Storage > Storage Devices 。
- 在 “Storage Devices” 中间面板中选择正确的磁盘。它应该是具有 Type 磁盘且未分配数据存储区的磁盘。
- 从上面选择正确的选项,将设备标记为本地设备。如果可用选项是标记为 “Remote”,则磁盘已是本地磁盘。
步骤5.添加新磁盘或磁盘组:
在添加磁盘或重新创建磁盘组之前,确保磁盘标记为本地磁盘。
- 选择群集并导航到 Configure(在旧版本中为“Manage”)> Settings > Disk Management。(在这里添加新磁盘。)
-
如何将磁盘添加到磁盘组:
- 提醒:可以将额外的容量驱动器添加到经过重复数据消除和压缩的磁盘组,而无需重新创建磁盘组。
- 在 磁盘组 面板中,滚动到正确的主机,然后选择新磁盘添加到的磁 盘组 。
- 选择正确的 磁盘组 ,然后单击它前面的 三个点 。
- 在出现的菜单中,选择 Add Disks 。在弹出窗口中 ,标记驱动器(如果驱动器未显示在此窗口上,请检查驱动器是否标记为本地),然后单击 添加 。
- 等待“Add disks for use by Virtual San”任务完成。导航至 Monitor > Tasks (监视>任务 )以查看进度。
- 在页面顶部刷新并确保磁盘组看起来正确无误(“Disks in Use”具有准确的数字,“State”显示“Mounted”)。
-
如何添加或重新创建整个磁盘组:
- 在“Disk Groups”面板中,滚动到创建磁盘组的正确主机。
- 在“Disk Groups”面板上方,单击 “Create Disk Group”按钮。
- 在出现的窗口中,选择缓存层部分中的缓存磁盘,然后在 Capacity Tier 部分中选择一个或多个容量驱动器,然后单击“OK”。
- 等待任务“Add disks for use by Virtual San”完成。导航至 Monitor > Tasks (监视> 任务 )以查看进度。
- 在页面顶部刷新并确保磁盘组看起来正确无误(“Disks in Use”具有准确的数字,“State”显示“Mounted”)。
提醒:此时,vCenter 和主机应显示磁盘“In Use for VSAN”且运行状况良好。VxRail Manager 数据库仍将保存有关已更换的旧磁盘的过时信息,在 物理运行状况 页面上显示缺失的磁盘。您现在也可以手动更新 VxRail Manager,以删除旧驱动器并将新驱动器添加到其数据库,使新驱动器显示在“Physical Health”中。VxRail 支持可以通过服务请求执行此过程。