FPIN(结构性能影响通知)消息,它们是什么以及有何含义
Summary: FPIN(结构性能影响通知)消息,它们是什么以及有何含义。
Instructions
结构性能影响通知 (FPIN) 消息旨在主动提醒结构网络中的设备注意可能影响性能的特定情况。
构造通知消息可用作预警系统,以减轻对构造性能的任何负面影响,开发用于优化 I/O 行为,并通过通知设备当前构造状况来避免路径受损。
其中包括有关链路完整性、传送通知和拥塞问题的通知。
结构通知是一种机制,可为终端设备提供有关结构中事件的更多信息,旨在帮助(用户)解决现代 FC SAN 中遇到的数据流问题。
通知实质上是告诉终端设备, "You are sending too much into the fabric" or "Beware, there is a problem ahead—slow down or switch paths."
终端设备会意识到问题,并可以采取行动以主动方式启动修正,将拥塞情况通知发送或接收设备,直到构造范围的事件开始。
FC 数据流和影响:
- FC 数据流可能受到以下三个问题的影响:
- 链路完整性:SAN 路径上的可疑/故障组件(SFP、线缆、配线架)可能会产生严重影响,并频繁导致应用程序降级、崩溃和中断。
-
- 不正确的多路径输入输出 (MPIO) 设置:大多数默认 MPIO 设置使用“轮询”。当出现链路完整性问题或拥塞时,设置为轮询的 MPIO 将继续使用受损(有问题但没有彻底失效)的路径将数据发送到结构中,这通常会导致拥塞或更糟的情况。
- 拥塞:当进入结构的帧速率超过离开结构的帧速率时会发生拥塞。这通常被视为排出缓慢。
-
-
- 超额订阅,当到达的帧数超过可处理的帧数(带宽不匹配)时,会发生超额订阅
- 如今,由于更高速的 32 Gbps 存储阵列与传统的 4 Gbps、8 Gbps 和 16 Gbps 结构混合在一起,这个问题更加突出
- 信用停滞,当设备停止返回信用时,链路会陷入停顿
- 信用停滞的设备被视为“排出缓慢”
- 信用丢失,当物理错误损坏帧或信用响应并减少链路容量时,会发生信用丢失
- 超额订阅,当到达的帧数超过可处理的帧数(带宽不匹配)时,会发生超额订阅
-
元素和要求:
结构通知的两种类型
-
- 基于软件的结构性能影响通知 (FPIN) ELS 消息(扩展链路服务)
- 基于硬件的拥塞信号原语 (CSP)
结构通知需要在结构中实现三个关键的结构服务,以便形成通知/在结构控制器(交换机)上运行核心扩展链路服务 (ELS)
-
- 交换诊断功能 (EDC)
- 寄存器诊断功能 (RDF)
- 结构性能影响通知 (FPIN)
- 设备如何注册通知:
- 设备必须支持 T11 通知标准。
- 存储、交换机、HBA、操作系统和多路径软件供应商提供广泛的支持
- 即将发布的有关结构通知的白皮书详细介绍了支持设备、固件和操作系统
- 想要接收信号和 FPIN 的终端设备在登录 (FLOGI) 后向结构控制器(通常是交换机)注册
- 设备必须支持 T11 通知标准。
- 要成功接收通知,设备必须:
- 注册以接收特定类型的通知。
- 遇到通知情况。
- 是存在通知情况的区域内对等设备。
想要接收信号和 FPIN 的终端设备在登录后 (FLOGI) 分别使用 EDC(交换诊断功能)和 RDF(注册诊断功能)向结构控制器注册。
要接收通知,设备必须注册才能接收特定通知,遇到通知条件,并且是存在通知条件的区域内对等设备。
系统可以为 4 种类型的事件生成 FPIN(软件):
- 链路完整性:MPIO 驱动程序接收链路完整性通知并管理路径选择。当 MPIO 连接到受损路径时,这些受影响的 MPIO 主机会收到通知,以便它们可以采取措施。
信息包括原因(链路故障、信号丢失、CRC 无效等)和违反的阈值。
- 拥塞:如果在结构 F 端口上检测到拥塞情况,所连接的终端设备将收到通知。
对于可以优化 I/O 调度(例如降低传输速率或发出串行读取 I/O)的终端设备,FPIN 拥塞通知是十分有价值的信息。
通常,拥塞通知会指明为什么交换完成可能需要较长时间。
- 对等拥塞:对等拥塞通知会发送到遇到拥塞的终端设备的所有已注册区域内对等方。
对等方可以利用各种补救措施来缓解这种类型的拥塞。
例如,如果对等方端口的自动协商速度比目标端口快,则对等方可以限制其数据速率以匹配目标的数据速率。
- 传送中断:当结构丢弃数据包时,结构通知会通过发送 FPIN 传送通知来向发起方告知失败情况。
无论命令是由 ISL 还是终端设备连接丢弃的,发送端都会收到通知。
信息包括原因代码(超时、无路由等)和丢弃的数据包标头,用于推断受丢包影响的流。
结构通知类型 — CSP(硬件)
- 基于硬件的拥塞信号原语 (CSP)
- 通常从检测端口的 FC-1 层(通常由底层固件)发送到已注册的设备
- 由通过直接连接的 Fibre Channel 设备之间的链路发送的光码(而非帧)组成。不受结构延迟问题的影响
- 提供对突发拥塞情况的快速检测(实时),并通过向连接的物理连接端口发出信号来立即做出反应
- PowerMax 不支持
- 拥塞信号:
它通常从检测端口的 FC-1 层(通常由底层固件)发送到已注册的设备。
除了 FPIN 之外还需要信号,因为即使没有可用信用,原语也可以在拥塞端口上传输(没有信用时,FPIN 帧必须等待)。
因此,与 FPIN 不同,信号可以视为拥塞的实时指标,具有更强的传送保证。
结构要求:
- Brocade
- 支持 Connectrix DS-66xx 交换机、MP-7810/7850B 和 ED-DCX6B 控制器硬件或更高版本
- Brocade 的 Fabric OS 9.0 或更高版本支持结构通知
- Fabric OS 9.2.0a 或更高版本支持 PowerMax 集成
- Fabric OS 9.2.0a 具有更精确的结构通知阈值
- FPIN-LI 需要 Fabric Vision 许可证
- 必须启用 MAPS 策略(保守、温和或主动)
- Cisco MDS
- Cisco 的 NX-OS 9.3.1 或更高版本支持结构通知
- 使用 9.3(2a) 测试了 PowerMax 集成
- 支持任何能够运行这些版本的交换机或控制器。
- 结构通知默认不启用,需要通过一些步骤来启用
- Cisco 的 NX-OS 9.3.1 或更高版本支持结构通知
- MPIO 和 PowerPath 需要支持结构通知的操作系统和 HBA。
- 并非所有组件都需要支持结构通知
- 例如,光纤老化和拥塞问题严重的传统 4G 和 8G HBA。
有关默认 FC 端口的故障处理,请始终遵循自助文章:
Connectrix:如何通过消除方式对光纤通道节点到交换机端口或 SFP 的通信问题进行故障处理,自助。
Additional Information
SAN 阵列和结构管理员可以通过正确清洁线缆上的光学接头来解决这些问题。 有关更多信息 ,请参阅所有产品:光纤线缆接头端面上的灰尘等污垢导致 IO 性能不佳