VPLEX:由于后端性能问题,VPlex 分布式设备上出现严重的写入延迟

摘要: 本文讨论如何在 VPLEX RAID-1 设备上出现后端性能问题时利用镜像隔离功能。

本文适用于 本文不适用于 本文并非针对某种特定的产品。 本文并非包含所有产品版本。

症状



主机遇到严重的写入延迟,这可能会导致性能 DU。

在 VPlex 端,可能存在状态为 0x2a 或 0x8a 的主机中止流(stdf/10 事件)。这意味着主机正在中止写入 IOs:

128.221.252.67/cpu0/log:5988:W/“00601672b5b475554-2”:126043:<6>2019/01/10 19:39:09.68: stdf/10 scsi tmf [中止任务] on fcp ITLQ:[10:00:00:00:C9:C9:AB:DC (0x10000000c9c9abdc) A0-FC00 (0x5000144260756500) 0x8000000000000 0x243] vol dd_vol taskElapsedTime(微秒) 5339 dormantQCnt 0 enabledQCnt 0 status 2a00000000000605:400ac800000002
128.221.252.67/cpu0/log:5988:W/“00601672b5b475554-2”:126043:<6>2019/01/10 19:39:09.68: stdf/10 scsi tmf [中止任务] on fcp ITLQ:[10:00:00:00:C9:C9:AB:DC (0x10000000c9c9abdc) A0-FC00 (0x5000144260756500) 0x8000000000000 0x243] vol dd_vol taskElapsedTime(微秒) 5339 dormantQCnt 0 enabledQCnt 0 status 2a00000000000605:400ac800000002
128.221.252.67/cpu0/log:5988:W/“00601672b5b475554-2”:126043:<6>2019/01/10 19:39:09.68: stdf/10 scsi tmf [中止任务] on fcp ITLQ:[10:00:00:00:C9:C9:AB:DC (0x10000000c9c9abdc) A0-FC00 (0x5000144260756500) 0x8000000000000 0x243] vol dd_vol taskElapsedTime(usec) 5339 dormantQCnt 0 enabledQCnt 0 status 2a0000000000605:400ac800000002



针对存储卷(与呈现给受影响主机的虚拟卷相对应)的后端超时流(scsi/140 事件):
 

firmware.log_20181019000922:128.221.253.36/cpu0/log:5988:W/“0060166fc49615528-1”:304763:<4>2019/01/10 19:39:09.68: scsi/140 Scsi command 0x7ec67ce41278 timeout, opcode 0x2a luid VPD83T3:600000 304764<> 20181019000922 0x5006016c47e02548 0x000f000000000000 firmware.log 0xc0014487873b8800 00000000000000000000000000000000000000000000000000000000000000000000000000000000000000000000000000000000000000000000000000000000000000000000000000000000000000000000000000000000000000000000000000000000000000000000000000000000000000000000000000000000000000000000000000000000000000000000000000000000000000000000000000000000000000000000000000000000000000000000000000000000000000000000000000000000000000000000000000000000000000000000000000000000000000000000000000000000000000000000000000000000000000000000000000000000000000000000000000000000000000000000000000000000000000000002019/01/10 19:39:09.68: scsi/140 Scsi command 0x7ec67b9c99f0 timeout, opcode 0x2a luid VPD83T3:60000000000000000000000000000000 nexus x fcp i 0xc0014487873b8800 t 0x5006016c47e02548 0x004f000000000000 firmware.log_20181019000922:128.221.253.36/cpu0/log:5988:W/“0060166fc49615528-1”:304765:<4>2019/01/10 19:39:09.68: scsi/140 Scsi command 0x7ec67f032f90 timeout, opcode 0x2a luid VPD83T3:6000000000000000000000000000000 nexus x fcp i 0xc0014487873b8900 t 0x5006016d47e025480x000f0000000000



还可以针对受影响的存储卷观察到性能降级事件(amf/249 事件)。

128.221.253.67/cpu0/log:5988:W/“0060166fd1a610335-2”:2359857:<4>2019/01/10 19:39:09.6: amf/249 Amf sop_xxxx性能已降级。平均写入 I/O 延迟从 0.0 毫秒增加到 216.197 毫秒,高于可接受的 200 毫秒限制。
128.221.253.67/cpu0/log:5988:W/“0060166fd1a610335-2”:2359857:<4>2019/01/10 19:39:09.6: amf/249 Amf sop_xxxx性能已降级。平均写入 I/O 延迟从 0.0 毫秒增加到 216.197 毫秒,高于可接受的 200 毫秒限制。
128.221.253.67/cpu0/log:5988:W/“0060166fd1a610335-2”:2359857:<4>2019/01/10 19:39:09.6: amf/249 Amf sop_xxxx性能已降级。平均写入 I/O 延迟从 0.0 毫秒增加到 216.197 毫秒,高于可接受的 200 毫秒限制。



基于性能较差的存储卷构建的 RAID-1 镜像分支可能会降低整个 RAID-1 设备的性能,并增加使用此设备的应用程序的 I/O 延迟。这是因为写入 I/O 仅在两个分支(其中一个是性能不佳的分支)确认后写入

原因

这可能是由于任何后端阵列或后端结构问题导致 VPLEX 上出现后端超时流。

解决方案

启用镜像隔离功能将缓解高延迟问题,因为它会隔离性能不佳的设备并阻止在其上处理 I/O。这应该允许应用程序恢复,直到后端问题得到解决。

VPlexcli:/>device mirror-isolation enable

VPlexcli:/>device mirror-isolation show
Cluster Enabled Auto unisolation Isolation Interval Unisolation Interval
--------- ------- ---------------- ------------------ --------------------
cluster-1 true true 60 14400
cluster-2 true true 60 14400



此功能将自动隔离[停止执行 I/O 以]性能不佳的 RAID-1 分支。它是按群集启用的。

优点:
  1.  自动功能,可以在问题发生后快速隔离性能不佳的分支 [通常在几分钟内]
  2.  当设备被取消隔离时,重建将自动进行,并且仅重建隔离设备分支时发生的更改。这通常只需要几分钟即可重新同步
  3. 可以轻松快速地启用和禁用该功能 
缺点:
  1. 当隔离设备分支时,顶级设备不再具有冗余
  2. 隔离设备分支后,VPLEX 将在 4 小时内不会检查取消分支隔离 [这可避免间歇性性能问题导致间歇性性能影响的情况]


有关镜像隔离功能的更多详细信息,请参阅《VPLEX 管理指南》。

使用镜像隔离只能缓解性能问题,从而停止性能影响。但是,需要进一步调查性能下降的根本原因。后端阵列和后端构造团队应参与进来,进一步调查此问题。

注意:
另请参阅知识库文章 530520“VPLEX:结构或阵列控制器中的单个组件故障可能会导致通过 VPLEX 访问存储的主机上出现持续的性能 DU”

其他信息

本内容以其他语言翻译: 
https://downloads.dell.com/TranslatedPDF/PT-BR_KB530258.pdf
https://downloads.dell.com/TranslatedPDF/ZH-CN_KB530258.pdf
https://downloads.dell.com/TranslatedPDF/AR-EG_KB530258.pdf
https://downloads.dell.com/TranslatedPDF/DE_KB530258.pdf
https://downloads.dell.com/TranslatedPDF/ES_KB530258.pdf
https://downloads.dell.com/TranslatedPDF/FR_KB530258.pdf
https://downloads.dell.com/TranslatedPDF/KO_KB530258.pdf
https://downloads.dell.com/TranslatedPDF/JA_KB530258.pdf
https://downloads.dell.com/TranslatedPDF/IT_KB530258.pdf
https://downloads.dell.com/TranslatedPDF/NL_KB530258.pdf
https://downloads.dell.com/TranslatedPDF/PT_KB530258.pdf
https://downloads.dell.com/TranslatedPDF/RU_KB530258.pdf
https://downloads.dell.com/TranslatedPDF/SV_KB530258.pdf

受影响的产品

VPLEX Series

产品

VPLEX for All Flash, VPLEX GeoSynchrony, VPLEX Series, VPLEX VS2, VPLEX VS6
文章属性
文章编号: 000168565
文章类型: Solution
上次修改时间: 22 12月 2025
版本:  4
从其他戴尔用户那里查找问题的答案
支持服务
检查您的设备是否在支持服务涵盖的范围内。