Connectrix:在对 SFP 收发器进行故障处理时如何解读 SFP 收发器的 TX 和 RX 功率水平
Summary: 使用 sfpshow (Brocade) 和 show interface transceiver details (Cisco) 中显示的测量光功率水平来识别交换机到交换机 (ISL) 和节点到交换机连接的物理层问题。
Symptoms
- 添加 ISL 或中继连接
- 扩大现有 ISL 连接的距离
- 终端设备 HBA 或 SFP 更换或升级
- 客户基础架构(布线、配线架、DCM、CWDM)问题或更改
- 将旧硬件替换为新硬件并使用相同的物理基础架构(线缆、配线架)。
连接上的物理层问题可能会导致连接不稳定,从而导致:
- 终端设备登录和退出结构
- 可能影响链路性能。
- 停止终端设备登录
- 导致结构扩展问题
- SFP TX 和 RX 功率读数未正确解读。
- 根据错误的解读错误地更换 SFP。
- 解读 show interface fcx/xx transceiver details TX 和 RX 功率。
- 解读 sfpshow 8/22 f TX 和 RX 功率。
Cause
- 对 SFP 输出的 TX 或 RX 计数器的错误解读导致不必要的 SFP 更换。
- 交换机端口 SFP 和线缆长度不正确。
- 使用了错误的线缆
- 客户基础架构(布线、配线架、DCM、CWDM)问题或更改。
- 交换机端口 SFP 发生故障。
Resolution
它还必须用作以下文章的辅助:
- SFP 更换前流程
- Connectrix:如何通过消除方式对光纤通道节点到交换机端口或 SFP 的通信问题进行故障处理。请参阅戴尔知识库文章 28863:Connectrix:如何通过消除方式对光纤通道节点到交换机端口或 SFP 的通信问题进行故障处理?(英文版)
如您所见,SFP 有两个连接 FC 光纤线缆的插座,SFP 上的每个插座代表自己的通道,一个通道用于发送 TX,另一个用于接收 RX,使 SFP 模块成为集发射器和接收器为一体的设备,也称为收发器。
从逻辑上看,FC 连接如下图所示:
在上面的示例中,您可以使用 HBA 更改 SFP,它遵循相同的结构,但为了方便说明,我们使用 ISL 连接。左侧是交换机端口 SFP,它使用线缆连接右侧的另一个交换机端口 SFP。
红色通道左侧 TX 收发器是光信号的源。查看此 SFP 上的 TX 功率,您查看的是源。查看右侧 SFP RX 功率的功率水平,您查看的是左侧 SFP 在穿过线缆并到达右侧 SFP 时产生的光能量,绿色通道则与此相反。
如何查看光功率水平
Brocade CLI 命令:
-
Sfpshow [slot]/port f admin> sfpshow 8/22 -f Identifier: 3 SFP
[截断]
Alarm Warn low high low high Temperature: 46 Centigrade -5 85 0 75 Current: 7.428 mAmps 2.500 12.000 2.000 11.500 Voltage: 3295.6 mVolts 3000.0 3600.0 3130.0 3460.0 RX Power: -3.3 dBm (466.6 uW) 31.6 uW 1258.9 uW 31.6 uW 794.0 uW TX Power: -2.5 dBm (560.4 uW) 126.0 uW 1258.9 uW 251.0 uW 794.0 uW
Cisco CLI 命令
- 显示接口 fc 模块/端口收发器详细信息。
# show interface fc1/12 transceiver details
[截断]
---------------------------------------------------------------------------- Alarms Warnings High Low High Low ---------------------------------------------------------------------------- Temperature 47.05 C 89.00 C -9.00 C 85.00 C -5.00 C Voltage 3.30 V 3.60 V 3.00 V 3.50 V 3.10 V Current 5.47 mA 10.00 mA 2.00 mA 10.00 mA 2.00 mA Tx Power -4.87 dBm 1.00 dBm -13.50 dBm -3.00 dBm -9.50 dBm Rx Power -7.69 dBm 4.00 dBm -21.02 dBm 0.00 dBm -16.99 dBm Transmit Fault Count = 0 ---------------------------------------------------------------------------- Note: ++ high-alarm; + high-warning; -- low-alarm; - low-warning
测量单位
如 brocade sfpshow 输出中所示,光功率级别以 dBm 和 uW 表示。
分贝 (dB) 是输出功率与输入功率之比,表示为 10*log(功率比率)。
dBm = 以分贝为单位的功率与 1mW (1000uW) 之比。0 dBm 的读数为 1mW。
如果功率读数为加 (+) dBm,则功率 > 1mW,减 (-) 则 < 1mW。
例如,在上面的 Brocade sfpshow 输出中,466uW 为 10*log(466/1000) = -3.3dBm。
此外还会显示以 uW 为单位的光功率。
uW = micro Watt,这是光功率的实际度量(而不是比率),
Cisco 仅提供 dBm 读数。
了解读数
当 TX 和 RX 功率读数在命令输出中提供的限制范围内,即表示 SFP 在可接受的水平内接收和发射光信号,因为在 SFP 上测量的功率受以下几个外部因素的影响:
- 光纤基础架构
- 配线架健康状况
- 布线健康状况
- 布线长度
- 接头数量(折射导致光信号损失)
- 温度会影响光功率测量。
因此,有一组广泛但明确定义的限制,所有这些限制都符合 IEEE 标准 BER(比特误差率)。
如果 RX 和 TX 功率读数需要关注,并且 RX 功率低于预期,我们将首先检查上述因素并应用 SFP 更换前流程(见上文),并执行收集 SFPshow -f (Brocade) or show interface transceiver details (Cisco) 命令输出的额外步骤,如下所示:
- 线缆移动之前
- 线缆移动之后
- 将线缆移回步骤 1 中的原始端口。
- 如果在步骤 1 中 RX 功率较低,在步骤 2 中正常,在步骤 3 中使用相同的布线且功率较低,则表示存在 SFP 问题并且应该应用 SFP 清理(请参阅戴尔知识库文章 45672:Connectrix、Symmetrix、CLARiiON、Celerra、VNX、RecoverPoint 和 VPLEX:Fibre Channel 检查和清洁套件部署的应用场景。),在清理后再次执行测试,如果重新测试产生相同的结果,则更换 SFP。
- 如果在步骤 1 中 RX 功率较低,在步骤 2 和步骤 3 中都正常,则表示线缆接头或 SFP 不干净。并且在测试期间,导致原始问题的碎屑被清除或移动,那么这仍是进行线缆和/或 SFP 清理和重新测试的候选项。
- 如果在步骤 1、步骤 2 和步骤 3 中 RX 功率均较低,则表明是交换机端口 SFP 外部的问题,应该是布线基础架构或终端设备存在问题。
注意:
链路相关问题的头号原因是线缆和光纤不干净,很多时候会被误认为是光纤故障。
例如,将新的速度更快 (16 Gb) 的交换机接入到现有环境中,然后使用现有光缆安装旧的和现有主机以及目标。
这是一个广泛而常见的事件,戴尔现场团队为此提供了光纤清洁套件来缓解这些问题。换言之,不要假设是光纤的问题。有关清洁套件的详细信息,请参阅戴尔知识库文章 45672:Connectrix、Symmetrix、CLARiiON、Celerra、VNX、RecoverPoint 和 VPLEX:Fibre Channel 检查和清洁套件部署的应用场景。
Additional Information
其他资源:
Brocade SFP 数据表的主链接:
http://www.brocade.com/products/all/transceivers/product-details/transceiver-modules/specifications.page
Cisco SFP 数据表的主链接:
http://www.cisco.com/c/en/us/products/collateral/storage-networking/mds-9000-series-multilayer-switches/product_data_sheet09186a00801bc698.html