VPLEX:结构或阵列控制器中的组件故障导致性能数据不可用

Summary: 本文讨论如何缓解与单个组件故障相关的问题,这可能会影响 VPLEX 环境中的性能。

This article applies to This article does not apply to This article is not tied to any specific product. Not all product versions are identified in this article.

Instructions

问题摘要
终端用户可能会遇到诸如漏液缓慢、阵列目标控制器故障、CRC 错误、交换机 ASIC 故障、交换机重新启动等问题,对连接到 VPLEX 的部分或所有主机产生严重影响。VPLEX 后端使用循环调度策略,该策略可能会导致一个结构上的问题影响该结构上的所有主机路径(或者也可能影响另一个结构上的路径)。
  
适用于交换机和阵列团队   
如果终端用户报告单个组件故障、慢漏等造成广泛影响,请与终端用户联系,了解环境中是否有 VPLEX。如果环境中有 VPLEX,并且已知问题的严重程度,请请求终端用户阻止交换机上受影响的路径。如果环境中有 VPLEX,并且受影响的路径未知,请联系 Dell EMC 客户支持,解释问题,并提及本文。

对于 VPLEX 团队
如果有一个终端用户报告持续影响的 SR,并且怀疑原因是由于后端路径性能不佳所致,请识别性能不佳的路径并在 VPLEX 中阻止它们。如果受影响的路径不明显,请联系指导员寻求帮助。影响结束后,即可进行交换机和阵列协作。

背景
VPLEX 到阵列 I/O 流
VPLEX 的运行方式与群集主机环境非常相似。从主机接收 I/O 的每个控制器负责完成该 I/O。每个控制器在两个结构之间有多条路径到每个 LUN。每个 VPLEX 控制器负责在所有可用的活动路径之间平衡 I/O。

VPLEX 故障检测和缓解
VPLEX 用于检测和缓解路径故障的主要方法是监视每条路径上的超时比率。如果 90% 的 I/O 在连续两个 15 秒时间段内超时,VPLEX 将消除受影响的路径并且不再使用它。然后,VPLEX 将定期探测放出的路径, 如果 在此路径上再次成功看到 I/O,则取消放逐该路径。

问题是如何产生的
由于路径放逐、频繁探测的高阈值和取消路径放逐的低阈值,VPLEX 可能会继续使用运行状况不佳的路径。结果是,VPLEX 可能会通过性能较差的路径或遇到软故障的路径发送大量 I/O。此 I/O 超时或需要过多的时间才能完成。结果是所有主机路径的响应时间显著增加。这可能会导致连接到 VPLEX 的任何或所有主机的性能数据不可用。


建议
升级到 VPLEX GeoSynchrony 目标代码 6.2 P3 或更高版本,以改进上述情况的缓解/处理。有关后端路径管理功能的更多详细信息,请参阅发行说明。

Affected Products

VPLEX Series

Products

VPLEX for All Flash, VPLEX Series, VPLEX VS2, VPLEX VS6
Article Properties
Article Number: 000157795
Article Type: How To
Last Modified: 03 يونيو 2025
Version:  4
Find answers to your questions from other Dell users
Support Services
Check if your device is covered by Support Services.