VPLEX:结构或阵列控制器中的组件故障导致性能数据不可用

摘要: 本文讨论如何缓解与单个组件故障相关的问题,这可能会影响 VPLEX 环境中的性能。

本文适用于 本文不适用于 本文并非针对某种特定的产品。 本文并非包含所有产品版本。

说明

问题摘要
终端用户可能会遇到诸如漏液缓慢、阵列目标控制器故障、CRC 错误、交换机 ASIC 故障、交换机重新启动等问题,对连接到 VPLEX 的部分或所有主机产生严重影响。VPLEX 后端使用循环调度策略,该策略可能会导致一个结构上的问题影响该结构上的所有主机路径(或者也可能影响另一个结构上的路径)。
  
适用于交换机和阵列团队   
如果终端用户报告单个组件故障、慢漏等造成广泛影响,请与终端用户联系,了解环境中是否有 VPLEX。如果环境中有 VPLEX,并且已知问题的严重程度,请请求终端用户阻止交换机上受影响的路径。如果环境中有 VPLEX,并且受影响的路径未知,请联系 Dell EMC 客户支持,解释问题,并提及本文。

对于 VPLEX 团队
如果有一个终端用户报告持续影响的 SR,并且怀疑原因是由于后端路径性能不佳所致,请识别性能不佳的路径并在 VPLEX 中阻止它们。如果受影响的路径不明显,请联系指导员寻求帮助。影响结束后,即可进行交换机和阵列协作。

背景
VPLEX 到阵列 I/O 流
VPLEX 的运行方式与群集主机环境非常相似。从主机接收 I/O 的每个控制器负责完成该 I/O。每个控制器在两个结构之间有多条路径到每个 LUN。每个 VPLEX 控制器负责在所有可用的活动路径之间平衡 I/O。

VPLEX 故障检测和缓解
VPLEX 用于检测和缓解路径故障的主要方法是监视每条路径上的超时比率。如果 90% 的 I/O 在连续两个 15 秒时间段内超时,VPLEX 将消除受影响的路径并且不再使用它。然后,VPLEX 将定期探测放出的路径, 如果 在此路径上再次成功看到 I/O,则取消放逐该路径。

问题是如何产生的
由于路径放逐、频繁探测的高阈值和取消路径放逐的低阈值,VPLEX 可能会继续使用运行状况不佳的路径。结果是,VPLEX 可能会通过性能较差的路径或遇到软故障的路径发送大量 I/O。此 I/O 超时或需要过多的时间才能完成。结果是所有主机路径的响应时间显著增加。这可能会导致连接到 VPLEX 的任何或所有主机的性能数据不可用。


建议
升级到 VPLEX GeoSynchrony 目标代码 6.2 P3 或更高版本,以改进上述情况的缓解/处理。有关后端路径管理功能的更多详细信息,请参阅发行说明。

受影响的产品

VPLEX Series

产品

VPLEX for All Flash, VPLEX Series, VPLEX VS2, VPLEX VS6
文章属性
文章编号: 000157795
文章类型: How To
上次修改时间: 04 5月 2026
版本:  5
从其他戴尔用户那里查找问题的答案
支持服务
检查您的设备是否在支持服务涵盖的范围内。