Connectrix:如何对 Connectrix Brocade B 系列交换机运行基本运行状况检查,自助。
Summary: Brocade 交换机上的常规运行状况检查
Instructions
如何对 Connectrix B 系列交换机运行基本运行状况检查。
对于初始诊断,运行 supportshow 命令可收集各种命令的输出。
如果需要进一步调查,您可能需要运行 supportsave(因为它包含 supportshow 和其他适合工程人员的信息),并将其附加到相应的服务请求。
要收集 supportshow,请参阅 EMC 知识库解决方案:
489144:Connectrix:如何使用 PuTTY 会话收集交换机日志文件(分步说明)。
Connectrix:如何使用 PuTTY 会话收集交换机日志文件(分步说明
一旦 supportshow 完成,使用任何文本文件编辑器打开该文件。下面列出的是输出中最有用的 supportshow 命令。
Additional Information
仅以小写形式输入命令;混合大小写是为了提高可读性。
- 示例基于 Fabric OS 8.2.x 或更高版本,请参阅“support by Product”页面(也适用于较旧的固件输出):https://www.dell.com/support/home/en-ie/products 搜索有问题的产品,并在“documentation”部分中查看命令指南。
- 有关命令的详细说明,另请参阅相关 Fabric OS 版本的命令指南。
- 验证交换机是否受 Dell Technologies 支持。
chassisShow
此命令清点并显示机箱和机箱背板版本中每个对象的 FRU 标头内容
版本。
它提供有关机箱、风扇、电源、SW 刀片(交换机)、CP 刀片(控制处理器)和 WWN 装置的详细信息。
此输出最适用于使用序列号确认这是 Dell Technologies 支持的交换机。
如果是 Dell Technologies 交换机,则有两个地方要检查。
其中大多数都以字母 EMC 开头。其次,下面两行是字段 Serial Num:
所有 Dell Technologies Connectrix B 系列交换机序列号都应以字母 BRC 开头。
示例:
WWN Unit: 1 ED-8510_4S_001:FID128:admin> chassishow [truncated] WWN Unit: 1 Header Version: 2 [truncated] ID: EMCXXXXXX Part Num: CONTRX0000DCX Serial Num: BRCXXXXXXXXXXX
- 固件:验证固件是否受支持。
firmwareShow
这显示主要和次要分区上的 Fabric OS 版本。对于具有多个控制处理器 (CP) 卡和 AP 刀片的系统,此命令会为本地和远程 CP 以及 AP 刀片显示此信息。验证固件级别后,您可以使用戴尔支持站点(查找资产并检查代码的可用性),确认该代码当前是否受 DELL EMC 支持。
ED-8510_4S_fid128:FID128:admin> firmwareshow
Slot Name Appl Primary/Secondary Versions Status
--------------------------------------------------------------------------
4 CP0 FOS v8.2.3c1 ACTIVE *
v8.2.3c1
5 CP1 FOS v8.2.3c1 STANDBY
v8.2.3c1
7 FX8-24 FOS v8.2.3c1
v8.2.3c1
- 交换机运行状况:
如果交换机受 Dell Technologies 支持,并且固件级别受支持,请搜索以下命令,以验证交换机运行状况。
- 监视和警报策略套件 (MAPS) 在 Fabric OS 8.2.x 及更高版本中,使用以下命令:
mapsdb --show
显示控制面板开始时间、活动策略、配置的警报、受防护的端口、停用的端口和隔离的端口。
Switch Health Report:
显示交换机的整体状态。如果整体状态不是“healthy”,则会列出影响因素和受防护的端口。
Summary Report:
显示确定交换机当前运行状况的监视类别的状态。每个类别的运行状况由一组监视系统或错误计数器以及活动策略中配置的规则所促成。
摘要视图显示每个类别的以下信息:从当天午夜开始收集的信息和过去 7 天收集的历史信息。
运行状况可以是以下之一:
No Error 没有发生错误。
In operating range:错误在活动策略中配置的阈值范围内。
Out of operating range:错误高于配置的阈值,这将触发活动策略中配置的规则。这表示交换机的某些属性超出了配置的范围。
Rules Affecting Health:显示导致当前交换机状态的情况。此时将显示以下信息:类别中触发的规则数、重复计数、触发的规则、执行时间、触发规则的元素以及触发的值。
History Data:显示特定时间窗口内的以下历史数据:监视系统、触发规则的当前值以及触发规则的元素。
History Data for Backend ports:显示在特定时间窗口内后端端口的错误统计信息。
如果您未指定操作数,则此命令将显示用法。
示例:
ED-8510_4S_fid128:FID128:admin> mapsdb --show
1 Dashboard Information:
=======================
DB start time: Sat Jan 1 00:01:50 2000
Active policy: dflt_moderate_policy
Configured Notifications: RASLOG,SNMP,SW_CRITICAL,SW_MARGINAL,SFP_MARGINAL
Fenced Ports : None
Decommissioned Ports : None
Fenced circuits : None
Quarantined Ports : None
Top Zoned PIDs <pid(it-flows)>:
2 Switch Health Report:
=======================
Current Switch Policy Status: MARGINAL
Contributing Factors:
---------------------
*EXPIRED_CERTS (MARGINAL).
3.1 Summary Report:
===================
Category |Today |Last 7 days |
--------------------------------------------------------------------------------
Port Health |No Errors |In operating range |
BE Port Health |No Errors |No Errors |
Extension GE Port Health |No Errors |No Errors |
Fru Health |In operating range |In operating range |
Security Violations |Out of operating range |Out of operating range |
Fabric State Changes |No Errors |In operating range |
Switch Resource |In operating range |In operating range |
Traffic Performance |In operating range |In operating range |
Extension Health |No Errors |No Errors |
Fabric Performance Impact|In operating range |In operating range |
3.2 Rules Affecting Health:
===========================
Category(Violation Count)|RepeatCount|Rule Name |Execution Time |Object |Triggered Value(Units)|
-----------------------------------------------------------------------------------------------------------------------------
Security Violations(46) |2 |defSWITCHSEC_TELNET_2 |03/28/24 20:35:18|Switch |3 Violations |
| | | |Switch |3 Violations |
|2 |defSWITCHSEC_LV_2 |03/28/24 20:35:18|Switch |3 Violations |
| | | |Switch |3 Violations |
|3 |defSWITCHSEC_TELNET_2 |03/27/24 20:35:06|Switch |4 Violations |
| | | |Switch |4 Violations |
| | | |Switch |3 Violations |
|3 |defSWITCHSEC_LV_2 |03/27/24 20:35:06|Switch |4 Violations |
| | | |Switch |4 Violations |
| | | |Switch |3 Violations |
|4 |defSWITCHSEC_TELNET_2 |03/26/24 20:34:53|Switch |4 Violations |
| | | |Switch |3 Violations |
| | | |Switch |4 Violations |
| | | |Switch |3 Violations |
- 可使用以下命令检查交换机和端口状态:
switchShow
使用此命令可显示交换机刀片和端口状态信息。
信息可能会因交换机型号而异:例如,端口数和域 ID 值。
- switchName - 交换机的符号名称。
- switchType - 交换机的型号和版本号。(请参阅知识库解决方案: Brocade 交换机类型与 ASIC、FOS 系列代码Connectrix Brocade B 系列:Brocade 交换机类型与 ASIC 以及 FOS 系列代码
- switchState - 交换机的状态:online、offline、testing 或 faulty。
- switchMode - 交换机的工作模式:访问网关(如果已启用 AG 的话。)
- switchRole - 交换机的角色:principal、subordinate 或 disabled。
- switchDomain - 交换机的域 ID:1-239。
- switchId - 交换机的嵌入式端口域 ID (D_ID)。
- switchWwn - 交换机的全球通用名称 (WWN)。
- zoning 活动区域集的名称。
- switchBeacon - 交换机的信标状态(on 或 off)。
- FC Router - FC 路由器的状态(on 或 off)
- FC Router BB Fabric ID - FC 路由的主干网构造 ID。
- HIF Mode - 指示交换机的高完整性构造 (HIF) 模式。值为 ON 或 OFF。
- Allow XISL Use - 指示交换机是否使用基本交换机之间的交换机间链接 (XISL),以将流量传输到逻辑交换机。
- LS Attributes - 显示逻辑交换机 (LS) 属性,其中包括 LS FID 编号。
ED_br8510_4S_001:FID128:admin> switchshow switchName: ED_br8510_4S_001 switchType: 121.3 switchState: Online switchMode: Native switchRole: Principal switchDomain: 2 switchId: fffc02 switchWwn: 10:00:00:05:1e:98:ba:00 zoning: ON (cfgExample) switchBeacon: OFF FC Router: OFF HIF Mode: OFF Allow XISL Use: OFF LS Attributes: [FID: 128, Base Switch: No, Default Switch: Yes, Address Mode 0]
switchshow 摘要之后是一行非 EX_Port 的描述以及一或两行 EX_Port 的描述:
Index 端口索引是介于 0 和平台最大端口之间的数字。索引用于标识相对于交换机的端口号。
Slot - 插槽编号;1-12。Port - 端口号;0-15、0-31、0-47 或 0-63。
Address - 24 位地址标识符。(FCID)
Media - 介质类型包括:
-- - 模块存在
cu - 铜
id - 序列 ID 指示 SFP 已安装。有关端口的更多信息,请使用 sfpshow 命令。
Speed - 端口的速度:
1G - 1 Gbit/sec 固定传输速度
N1 - 1 Gbit/sec 协商传输速度
2G - 2 Gbit/sec 固定传输速度
N2 - 2 Gbit/sec 协商传输速度
4G - 4 Gbit/sec 固定传输速度
N4 - 4 Gbit/sec 协商传输速度
8G - 8 Gbit/sec 固定传输速度
N8 - 8 Gbit/sec 协商传输速度
10G - 10 Gbit/sec 固定传输速度
10N - 10 Gbit/sec 协商传输速度
16G - 16 Gbit/sec 固定传输速度
N16 - 16 Gbit/sec 协商传输速度
32G - 32 Gbit/sec 固定传输速度
N32 - 32 Gbit/sec 协商传输速度
64G - 64 Gbit/sec 固定传输速度
N64 - 64 Gbit/sec 协商传输速度
AN - 自动协商
UN - 未知
State - 端口状态信息:
No_Card - 没有接口卡。
No_Module - 没有模块(GBIC 或其他)。
Mod_Val - 正在进行模块验证。
Mod_Inv - 无效的模块。
Mod_Uns - 模块不受支持。
No_Light - 模块未接收到光。此状态不适用于支持 16 Gb/s 的机箱间链路 (ICL) 端口。
No_SigDet - 端口上未检测到信号。对于支持 16Gbps 的机箱间链接 (ICL) 端口,此状态会替换 No_Light 指示灯。它指示四通道小型可插拔 (QSFP) 端口已安装,但未与线缆连接。
No_Sync - 模块接收到光,但不同步。
In_Sync - 模块接收到光,并且同步。
Laser_Flt - 模块发出激光故障信号。
Port_Flt - 端口标记为“faulty”。
Hard_Flt - 端口出现硬故障。
Diag_Flt - 端口诊断失败。
Lock_Ref - 锁定到参考信号。
Testing - 运行诊断。
Offline - 未建立连接(仅适用于虚拟端口)。
Online - 端口已开启并正在运行。
Transient - 端口被 MAPS 禁用并重新启用,以从目标设备造成的瓶颈状况中恢复。
Proto - GbE 端口支持的协议。
FC - 端口支持光纤通道。
ISCSI - 端口支持 ISCSI。
FCIP - 端口支持 FCIP。
FCoE - 端口支持以太网光纤通道。
LAN - 端口支持 LAN。
Comment - 登录端口后面的“Comment”字段为空白或显示:
Copper or Optical - 显示 Brocade 7810 交换机中哪个 GbE 端口当前处于活动状态。
当前活动的 GbE 端口接受铜线连接和光纤连接 (SFP)。
Loopback - 端口处于环回模式。
D_Port - 诊断端口;可以在 E_Port 和 F_Port 上配置 D_Port 功能。E_Port 上的 D_Port 显示远程交换机的全球通用节点名称 (WWNN),F_Port 上的 D_Port 显示远程端口的全球通用端口名称 (WWPN)。
E_Port - 显示连接的交换机的 WWN 和名称。如果端口已配置为 EX_Port,则连接的交换机的 WWN 与路由器的 WWN 相同。
F_Port - 点对点端口;显示连接的 N_Port 的 WWN。请参阅命令指南。
G_Port - 点对点,但不是 E_Port 或 F_Port。
L_Port - 环路端口;显示 NL_Port 的数量。
EX_Port - 路由器端口;显示连接的边缘交换机的 WWN。
VF_Port - FCoE 虚拟的 F_Port。请参阅命令指南。
VF-Port - 已禁用 - FCoE Virtual F_Port 已禁用。
D_Port Dynamic - 端口处于动态 D_Port 模式。
D_Port On-demand - 端口处于按需 D_Port 模式。
D_Port protocol violation - 端口卡在 G_Port 状态。
D_Port F_Port WWN Dynamic - 端口在 D_Port 模式下连接到设备端口。
SIM Port - 端口是模拟端口
Mirror Port - 端口是镜像端口。
(Trunk master) - 端口是一组中继端口中的主端口。
(Trunk port, master is port #x) - 端口已配置为中继端口;主端口是端口 #x。
(upstream) - E_Port 是通向构造主体交换机的上游路径。
(downstream) - E_Port 是远离构造的主交换机的下游路径。
Persistently Disabled - 已使用 portCfgPersistentDisable 禁用此端口。
FICON Persistent DID - 此端口已禁用,因为如果您启用 FICON 模式,则交换机在构造重新配置期间
无法获取其配置域 ID。有关更多信息,请参阅 ficonShow。
Fabric ID conflict - 已为两个不同的构造分配了相同的构造 ID(仅限 EX_Port 端口)。
Fabric ID oversubscribed - 已为一个构造分配了两个不同的构造 ID(仅限 EX_Port 端口)。
AoQ - 支持服务质量的面向应用的 QOS 连接设备。
LB mode - 如果接入网关无法协商支持 QoS 的链接。
Segmented - 由于多种原因而被细分或禁用。请参阅命令指南。
示例:
Index Slot Port Address Media Speed State Proto
============================================================
[truncated]
15 15 010f00 -- N16 No_Module FC
16 16 011000 -- N16 No_Module FC
17 17 011100 id N16 Online FC D-Port 10:00:00:05:33:a9:ec:56 Dynamic
[truncated]
24 24 011800 id N16 No_Light FC
25 25 011900 id N16 Online FC E-Port 10:00:00:05:33:a9:ec:56 "br6510b_001" (upstream)(Trunk master)
26 26 011a00 id N16 No_Light FC
27 27 011b00 id N16 Online FC Loopback->Port 27
28 28 011c00 -- N16 No_Module FC
-
porterrshow
- 使用此命令可显示所有端口的错误摘要。对于每个端口,该显示内容包含一个输出行,并以个位数、千 (k)、百万 (m) 或十亿 (g) 为单位显示错误计数器。
有关计数器的完整说明以及要采取的操作,请参阅以下两篇文章。
- Connectrix B 系列:如何解释 Brocade porterrshow 输出以及计数器的含义。自助
- Connectrix:如何通过消除方式对光纤通道节点到交换机端口或 SFP 的通信问题进行故障处理,自助。
-
slotShow -m
(仅适用于企业控制器)
Slot - 显示物理插槽编号。
Blade Type - 显示刀片类型:
SW BLADE - 该刀片是交换机。
CP BLADE - 该刀片是控制处理器。
UNKNOWN - 刀片不存在或其类型无法识别。
ID - 显示刀片类型 Id,请参阅
Connectrix B 系列:在 Brocade 交换机控制器里的 slotshow 输出中不同刀片 ID 是什么。(英文版)
Status - 显示刀片的状态:
INSERTED, NOT POWERED ON - 刀片存在于插槽中,但已关闭。
POWERING UP - 刀片存在,并且已通电。
LOADING - 刀片存在,已通电,正在加载初始配置。
DIAG RUNNING POST1 - 刀片存在,已通电,正在运行 POST(开机自检)。
DIAG RUNNING POST2 - 刀片存在,已通电,正在运行预启动开机自检)。
INITIALIZING - 刀片存在,已通电,正在初始化硬件组件。
ENABLED - 刀片已打开并启用。
ENABLED (User Ports Disabled) - 刀片已打开,但使用 bladeDisable 禁用了外部端口。
DISABLED - 刀片已通电,但遭到禁用。
FAULTY - 刀片出现故障,因为检测到错误。
UNKNOWN - 刀片已插入,但其状态无法进行确定。
-
errDump
此命令显示所有交换机实例和机箱的外部错误日志消息,并且不分页。
如果您正在处理呼叫总部服务请求,则可以在这里找到导致呼叫总部的错误。
错误按时间顺序从上到下(从最早到最新)进行记录,因此如果交换机呼叫总部,您可能会发现相关的错误消息更靠近 errdump 输出的底部。
每条消息都显示以下内容:
Timestamp - 消息的时间戳。
Message ID - 消息标识符。
External sequence number - 消息的序列号
Security audit flag - 已记录安全审核。字段中会显示“AUDIT”。
Severity - 消息的严重性。有效值包括 INFO、WARNING、ERROR 和 CRITICAL。
Switch name - 此消息的生成器或机箱的交换机名称。
Message - 消息正文。
-
haDump hashow haredundancy --show
仅适用于企业控制器。使用此命令可显示有关交换机或机箱上的高可用性 (HA) 功能状态的信息。此命令显示以下信息:
时间戳
本地 CP 状态(插槽编号和 CP ID)
远程 CP 状态(插槽编号和 CP ID)
恢复类型(热或冷)
高可用性(启用或禁用)
心跳(正常或停止)
备用 CP 的运行状况(healthy、failed 或 unknown),定义如下:
Healthy - 备用 CP 正在运行,后台运行状况诊断未检测到任何错误。
Failed - 备用 CP 正在运行,但后台运行状况诊断发现刀片存在问题。您应检查日志以确定适当的修复操作。在修复备用 CP 之前,故障切换处于禁用状态。有关备用 CP 中发生故障的设备的信息将会显示。
Unknown - 备用 CP 运行状况未知,因为备用 CP 不存在,心跳停止或运行状况监视器检测到配置文件错误。
HA 同步状态:
HA State Synchronized - 系统目前已完全同步。如果必须进行故障切换,那么它将不会对运行造成中断。
HA State Not In Sync - 由于备用 CP 出现故障、发出 haSyncStop 命令或出现系统错误,系统无法使两个 CP 同步。如果必须进行故障切换,那么当前备用CP 将重新启动,而且故障切换会造成运行中断。
IP 和光纤通道地址已针对交换机进行配置。
其他内部 HA 状态信息可能会更改。
示例:
ED_br8510_4S_001:FID128:admin> hadump --------------------------------------- TIME_STAMP: Jul 10 09:51:33.769077 --------------------------------------- Local CP (Slot 4, CP0): Active, Warm Recovered Remote CP (Slot 5, CP1): Standby, Healthy HA enabled, Heartbeat Up, HA State synchronized [truncated]
“haRedundancy --show”命令。
使用此命令可显示交换机正常运行时间和机箱控制处理器冗余统计信息。对于机箱,该命令显示控制处理器冗余设置和交换机正常运行时间。对于交换机,该命令仅显示交换机正常运行时间。请参阅命令指南。
显示的内容包含以下信息:
Current active session:显示当前会话的设置。
- HA synchronization status(HA 同步状态)。
- Active slot state:显示 CP ID、显示 CP 是本地的还是远程的,以及显示恢复类型信息。
- Standby slot state:显示 CP ID,以及显示 CP 是本地的还是远程的。
- Start time:显示处于同步状态的服务的开始时间。
Previous active session:显示上一个活动会话的设置。
- Active slot state:显示 CP ID 和恢复类型信息。
- Standby slot state:显示 CP ID 信息。
- Start time:显示处于同步状态的会话服务的开始时间。
- End time:显示由预期或意外恢复引起的会话的结束时间。
System uptime:显示系统服务的开始时间。当发生电源循环或两个 CP 一起重置时,此项会发生变化。
如果问题(目前不影响生产)似乎是端口级别的问题,并且您必须获得一组新的端口错误,请清除统计信息或需要进一步故障处理:
请参阅以下 KB 文章:
Connectrix:连接问题或端口问题遵循预 SFP 更换步骤进行操作(英文版)
Connectrix:如何通过消除方式对光纤通道节点到交换机端口或 SFP 的通信问题进行故障处理,自助。
要清除统计信息:
请通过 Putty 连接到交换机
如果正在使用虚拟构造,则运行:
fosexec --fid all -cmd "statsclear";fosexec --fid all -cmd "slotstatsclear"
或者,如果交换机正在运行 FOS 7.3 及更高版本,则命令是:
supportinfoclear --clear
如果没有在使用虚拟构造,则运行:
statsclear;slotstatsclear
让错误累积 4 到 8 个小时。
运行新的
supportshow or supportsave
查看
porterrshow
(有关 porterrshow 输出和要采取的操作,请参阅上述知识库文章。)
如果在首次查看 supportshow后问题没有得到解决,则运行:
supportsave
请参阅知识库文章:
Connectrix:如何使用 SANnav、CLI 和织锦 USB
收集织锦 Supportsave 日志将输出和您的调查结果附加到相应的服务请求,并相应地将 SR 重新排队。
请参阅此发布的视频:
您也可以在 YouTube 上观看此视频。