VPLEX:活动元卷共享阵列
Summary: 本文讨论如果在运行 NDU 预检查期间脚本报告活动元卷分支位于同一阵列上,该怎么办。
Symptoms
运行 NDU precheck 命令时、在计划的 NDU 之前或在 NDU 之外检查 VPLEX 的状态时,precheck 命令会报告活动元卷正在共享后端 (BE) 阵列。
Cause
此问题是由 precheck 命令看到活动元卷的两个分支位于同一后端阵列上引起的。这可能是由于:
- 元卷最初仅配置了一个可用的后端阵列,并且在该单个阵列上设置了两个分支。将第二个阵列添加到 VPLEX 时,此情况未更新。
- 元卷最初是由用户设置一个阵列中的两个卷来配置的,即使有两个或更多阵列连接到 VPLEX 也是如此。在将两个或更多阵列连接到 VPLEX 的情况下,不支持此作,必须通过在两个不同阵列上设置分支的情况下重新配置元卷来修复。
Resolution
要更正此错误,请检查第二个阵列上是否有另一个满足元卷所需条件的卷(如果现在有第二个阵列可用)。
元卷的最佳实践要求是必须有两 (2) 个存储卷:
-
无人 认领
-
78 GB 或更大
-
在不同阵列上
-
厚置备(不是使用精简 LUN 构建的)
步骤:
-
使用知识库文章 000158150“VPlex:如何列出可用于创建元数据卷的合格候选存储卷“,了解显示满足 VPLEX 元卷标准的存储卷的过程。
-
在其他阵列上有另一个卷满足条件后,请使用 CLI 命令将此新卷连接到当前元卷:
meta-volume attach-mirror。输出示例:
VPlexcli:/> meta-volume attach-mirror --storage-volume VPD83T3:60060160c9c02xxxxxxxxxxxxx99e711 --meta-volume C1_Meta
-
在 VPlexcli 提示符下,将目录 (cd) 更改为“system-volumes”上下文,并运行长列表“ll”命令。您应该会看到活动元数据卷的“operational status”显示为“degraded”,运行状况状态显示为“minor-failure”。
VPlexcli:/clusters/cluster-1/system-volumes> ll Name Volume Type Operational Health State Active Ready Geometry Component Block Block Capacity Slots ------------------------------- -------------- Status ------------- ------ ----- -------- Count Count Size -------- ----- ------------------------------- -------------- ----------- ------------- ------ ----- -------- --------- -------- ----- -------- ----- C1_Logging_vol logging-volume ok ok - - raid-1 1 2621440 4K 10G - C1_Meta meta-volume degraded minor-failure true true raid-1 3 20971264 4K 80G 64000 C1_Meta_backup_2018Jun05_120042 meta-volume ok ok false true raid-1 1 20971264 4K 80G 64000 -
运行命令:
rebuild status。这应将元卷显示为正在重建,并且“rebuild type”应为“full”,因为它是新的重建。VPlexcli:/clusters/cluster-1/system-volumes> rebuild status [1] storage_volumes marked for rebuild Global rebuilds: No active global rebuilds. cluster-1 local rebuilds: device rebuild type rebuilder director rebuilt/total percent finished throughput ETA ------- ------------ ------------------ ------------- ---------------- ---------- --------- C1_Meta full s1_0339_spa 20.1G/80G 25.07% 63.2M/s 16.2min
-
检查元卷的组件级别,以查看新连接的分支。运行命令:
ll <meta-volume name>/components。这将新组件显示为“插槽编号 2”,如下例所示,其“运行状态”为“错误”,其“运行状况”为“严重故障”。输出示例:
VPlexcli:/clusters/cluster-1/system-volumes> ll C1_Meta/components/ /clusters/cluster-1/system-volumes/C1_Meta/components: Name Slot Type Operational Health State Capacity ---------------------------------------- Number -------------- Status ---------------- -------- ---------------------------------------- ------ -------------- ----------- ---------------- -------- VPD83T3:600601601330270098b5c2118665e611 0 storage-volume ok ok 80G VPD83T3:600601601330270098b5c2118699e711 1 storage-volume ok ok 80G VPD83T3:60060160c9c02c00c47cb55a4a99e711 2 storage-volume error critical-failure 80G <<<< -
等待完全重建完成,这可能需要一些时间,请耐心等待。您可以通过运行“rebuild status”命令来检查重建的状态,关闭和打开,直到看到重建已完成。
VPlexcli:/clusters/cluster-1/system-volumes> rebuild status Global rebuilds: No active global rebuilds. Local rebuilds: No active local rebuilds.
-
重复步骤 3,元卷现在应显示其“Operational Status”,其“Health State”为“ok”。
VPlexcli:/clusters/cluster-1/system-volumes> ll Name Volume Type Operational Health Active Ready Geometry Component Block Block Capacity Slots ------------------------------- -------------- Status State ------ ----- -------- Count Count Size -------- ----- ------------------------------- -------------- ----------- ------ ------ ----- -------- --------- -------- ----- -------- ----- C1_Logging_vol logging-volume ok ok - - raid-1 1 2621440 4K 10G - C1_Meta meta-volume ok ok true true raid-1 3 20971264 4K 80G 64000 <<<< C1_Meta_backup_2018Jun05_120042 meta-volume ok ok false true raid-1 1 20971264 4K 80G 64000 -
重复 5 次以检查新分支是否显示为“插槽编号 2”,其“Operational State”和“Health State”均显示为“ok”。
VPlexcli:/clusters/cluster-1/system-volumes> ll C1_Meta/components/ /clusters/cluster-1/system-volumes/C1_Meta/components: Name Slot Type Operational Health Capacity ---------------------------------------- Number -------------- Status State -------- ---------------------------------------- ------ -------------- ----------- ------ -------- VPD83T3:600601601330270098b5c2118665e611 0 storage-volume ok ok 80G VPD83T3:600601601330270098b5c2118699e711 1 storage-volume ok ok 80G VPD83T3:60060160c9c02c00c47cb55a4a99e711 2 storage-volume ok ok 80G -
通过运行如下所示的命令,删除列为插槽 1 的元卷分支,因为它与列为插槽 0 的分支位于同一阵列上:
输出示例:
VPlexcli:/clusters/cluster-1/system-volumes> meta-volume detach-mirror -d VPD83T3:600601601330270098b5c2118699e711 -v C1_Meta
-
再次运行步骤 8 中的命令,您现在应该只看到列出的两个卷,每个卷来自不同的阵列,“插槽编号”分别代表着“0”和“1”。
VPlexcli:/clusters/cluster-1/system-volumes> ll C1_Meta/components/ /clusters/cluster-1/system-volumes/C1_Meta/components: Name Slot Type Operational Health Capacity ---------------------------------------- Number -------------- Status State -------- ---------------------------------------- ------ -------------- ----------- ------ -------- VPD83T3:600601601330270098b5c2118665e611 0 storage-volume ok ok 80G VPD83T3:60060160c9c02c00c47cb55a4a99e711 1 storage-volume ok ok 80G
-
通过运行 CLI 命令确认元卷和备份元卷正常,如下所示:
VPlexcli:/> ll /clusters/*/system-volumes/ /clusters/cluster-1/system-volumes: Name Volume Type Operational Health Active Ready Geometry Component Block Block Capacity Slots ------------------------------- -------------- Status State ------ ----- -------- Count Count Size -------- ----- ------------------------------- -------------- ----------- ------ ------ ----- -------- --------- -------- ----- -------- ----- C1_Logging_vol logging-volume ok ok - - raid-1 1 2621440 4K 10G - C1_Meta meta-volume ok ok true true raid-1 2 20971264 4K 80G 64000 C1_Meta_backup_2018Jun04_120017 meta-volume ok ok false true raid-1 1 20971264 4K 80G 64000 C1_Meta_backup_2018Jun05_120042 meta-volume ok ok false true raid-1 1 20971264 4K 80G 64000 /clusters/cluster-2/system-volumes: Name Volume Type Operational Health Active Ready Geometry Component Block Block Capacity Slots ------------------------------- -------------- Status State ------ ----- -------- Count Count Size -------- ----- ------------------------------- -------------- ----------- ------ ------ ----- -------- --------- -------- ----- -------- ----- C2_Logging_vol logging-volume ok ok - - raid-0 1 2621440 4K 10G - C2_Meta meta-volume ok ok true true raid-1 2 20446976 4K 78G 64000 C2_Meta_backup_2018Jul01_060025 meta-volume ok ok false true raid-1 1 20446976 4K 78G 64000 C2_Meta_backup_2018Jul02_060022 meta-volume ok ok false true raid-1 1 20971264 4K 80G 64000
-
由于您创建了元卷,因此备份元卷不准确。如上面步骤 11 中所示,cluster-1(其中为此知识库文章中的示例创建了新的元卷)上的元数据备份显示为上次运行备份的时间大约在 6 月初。您必须销毁旧备份并配置新备份。要执行此作,请参阅知识库文章 000038636“VPLEX:0x8a4a6006,0x8a4a6003,0x8a4a6005,无法完成元卷自动备份(或)不存在有效的备份元卷(或)无法销毁元数据备份“,然后按照解决方法部分下的解决方法中的步骤进行作。当两个或多个阵列连接到 VPLEX 时,每个备份卷也必须位于不同的阵列上。这是出于冗余目的。