VPLEX:由于后端性能问题,VPlex 分布式设备上出现严重的写入延迟

Summary: 本文讨论如何在 VPLEX RAID-1 设备上出现后端性能问题时利用镜像隔离功能。

This article applies to This article does not apply to This article is not tied to any specific product. Not all product versions are identified in this article.

Symptoms



主机遇到严重的写入延迟,这可能会导致性能 DU。

在 VPlex 端,可能存在状态为 0x2a 或 0x8a 的主机中止流(stdf/10 事件)。这意味着主机正在中止写入 IOs:

128.221.252.67/cpu0/log:5988:W/“00601672b5b475554-2”:126043:<6>2019/01/10 19:39:09.68: stdf/10 scsi tmf [中止任务] on fcp ITLQ:[10:00:00:00:C9:C9:AB:DC (0x10000000c9c9abdc) A0-FC00 (0x5000144260756500) 0x8000000000000 0x243] vol dd_vol taskElapsedTime(微秒) 5339 dormantQCnt 0 enabledQCnt 0 status 2a00000000000605:400ac800000002
128.221.252.67/cpu0/log:5988:W/“00601672b5b475554-2”:126043:<6>2019/01/10 19:39:09.68: stdf/10 scsi tmf [中止任务] on fcp ITLQ:[10:00:00:00:C9:C9:AB:DC (0x10000000c9c9abdc) A0-FC00 (0x5000144260756500) 0x8000000000000 0x243] vol dd_vol taskElapsedTime(微秒) 5339 dormantQCnt 0 enabledQCnt 0 status 2a00000000000605:400ac800000002
128.221.252.67/cpu0/log:5988:W/“00601672b5b475554-2”:126043:<6>2019/01/10 19:39:09.68: stdf/10 scsi tmf [中止任务] on fcp ITLQ:[10:00:00:00:C9:C9:AB:DC (0x10000000c9c9abdc) A0-FC00 (0x5000144260756500) 0x8000000000000 0x243] vol dd_vol taskElapsedTime(usec) 5339 dormantQCnt 0 enabledQCnt 0 status 2a0000000000605:400ac800000002



针对存储卷(与呈现给受影响主机的虚拟卷相对应)的后端超时流(scsi/140 事件):
 

firmware.log_20181019000922:128.221.253.36/cpu0/log:5988:W/“0060166fc49615528-1”:304763:<4>2019/01/10 19:39:09.68: scsi/140 Scsi command 0x7ec67ce41278 timeout, opcode 0x2a luid VPD83T3:600000 304764<> 20181019000922 0x5006016c47e02548 0x000f000000000000 firmware.log 0xc0014487873b8800 00000000000000000000000000000000000000000000000000000000000000000000000000000000000000000000000000000000000000000000000000000000000000000000000000000000000000000000000000000000000000000000000000000000000000000000000000000000000000000000000000000000000000000000000000000000000000000000000000000000000000000000000000000000000000000000000000000000000000000000000000000000000000000000000000000000000000000000000000000000000000000000000000000000000000000000000000000000000000000000000000000000000000000000000000000000000000000000000000000000000000000000000000000000000000000002019/01/10 19:39:09.68: scsi/140 Scsi command 0x7ec67b9c99f0 timeout, opcode 0x2a luid VPD83T3:60000000000000000000000000000000 nexus x fcp i 0xc0014487873b8800 t 0x5006016c47e02548 0x004f000000000000 firmware.log_20181019000922:128.221.253.36/cpu0/log:5988:W/“0060166fc49615528-1”:304765:<4>2019/01/10 19:39:09.68: scsi/140 Scsi command 0x7ec67f032f90 timeout, opcode 0x2a luid VPD83T3:6000000000000000000000000000000 nexus x fcp i 0xc0014487873b8900 t 0x5006016d47e025480x000f0000000000



还可以针对受影响的存储卷观察到性能降级事件(amf/249 事件)。

128.221.253.67/cpu0/log:5988:W/“0060166fd1a610335-2”:2359857:<4>2019/01/10 19:39:09.6: amf/249 Amf sop_xxxx性能已降级。平均写入 I/O 延迟从 0.0 毫秒增加到 216.197 毫秒,高于可接受的 200 毫秒限制。
128.221.253.67/cpu0/log:5988:W/“0060166fd1a610335-2”:2359857:<4>2019/01/10 19:39:09.6: amf/249 Amf sop_xxxx性能已降级。平均写入 I/O 延迟从 0.0 毫秒增加到 216.197 毫秒,高于可接受的 200 毫秒限制。
128.221.253.67/cpu0/log:5988:W/“0060166fd1a610335-2”:2359857:<4>2019/01/10 19:39:09.6: amf/249 Amf sop_xxxx性能已降级。平均写入 I/O 延迟从 0.0 毫秒增加到 216.197 毫秒,高于可接受的 200 毫秒限制。



基于性能较差的存储卷构建的 RAID-1 镜像分支可能会降低整个 RAID-1 设备的性能,并增加使用此设备的应用程序的 I/O 延迟。这是因为写入 I/O 仅在两个分支(其中一个是性能不佳的分支)确认后写入

Cause

这可能是由于任何后端阵列或后端结构问题导致 VPLEX 上出现后端超时流。

Resolution

启用镜像隔离功能将缓解高延迟问题,因为它会隔离性能不佳的设备并阻止在其上处理 I/O。这应该允许应用程序恢复,直到后端问题得到解决。

VPlexcli:/>device mirror-isolation enable

VPlexcli:/>device mirror-isolation show
Cluster Enabled Auto unisolation Isolation Interval Unisolation Interval
--------- ------- ---------------- ------------------ --------------------
cluster-1 true true 60 14400
cluster-2 true true 60 14400



此功能将自动隔离[停止执行 I/O 以]性能不佳的 RAID-1 分支。它是按群集启用的。

优点:
  1.  自动功能,可以在问题发生后快速隔离性能不佳的分支 [通常在几分钟内]
  2.  当设备被取消隔离时,重建将自动进行,并且仅重建隔离设备分支时发生的更改。这通常只需要几分钟即可重新同步
  3. 可以轻松快速地启用和禁用该功能 
缺点:
  1. 当隔离设备分支时,顶级设备不再具有冗余
  2. 隔离设备分支后,VPLEX 将在 4 小时内不会检查取消分支隔离 [这可避免间歇性性能问题导致间歇性性能影响的情况]


有关镜像隔离功能的更多详细信息,请参阅《VPLEX 管理指南》。

使用镜像隔离只能缓解性能问题,从而停止性能影响。但是,需要进一步调查性能下降的根本原因。后端阵列和后端构造团队应参与进来,进一步调查此问题。

注意:
另请参阅知识库文章 530520“VPLEX:结构或阵列控制器中的单个组件故障可能会导致通过 VPLEX 访问存储的主机上出现持续的性能 DU”

Additional Information

本内容以其他语言翻译: 
https://downloads.dell.com/TranslatedPDF/PT-BR_KB530258.pdf
https://downloads.dell.com/TranslatedPDF/ZH-CN_KB530258.pdf
https://downloads.dell.com/TranslatedPDF/AR-EG_KB530258.pdf
https://downloads.dell.com/TranslatedPDF/DE_KB530258.pdf
https://downloads.dell.com/TranslatedPDF/ES_KB530258.pdf
https://downloads.dell.com/TranslatedPDF/FR_KB530258.pdf
https://downloads.dell.com/TranslatedPDF/KO_KB530258.pdf
https://downloads.dell.com/TranslatedPDF/JA_KB530258.pdf
https://downloads.dell.com/TranslatedPDF/IT_KB530258.pdf
https://downloads.dell.com/TranslatedPDF/NL_KB530258.pdf
https://downloads.dell.com/TranslatedPDF/PT_KB530258.pdf
https://downloads.dell.com/TranslatedPDF/RU_KB530258.pdf
https://downloads.dell.com/TranslatedPDF/SV_KB530258.pdf

Affected Products

VPLEX Series

Products

VPLEX for All Flash, VPLEX GeoSynchrony, VPLEX Series, VPLEX VS2, VPLEX VS6
Article Properties
Article Number: 000168565
Article Type: Solution
Last Modified: 22 Dec 2025
Version:  4
Find answers to your questions from other Dell users
Support Services
Check if your device is covered by Support Services.