PowerFlex 管理平台 — Cisco Nexus 交换机升级因 SSH 超时而失败

Summary: 在 Cisco Nexus 交换机固件升级期间,由于通过 SSH 传输 NX-OS 映像文件时出现超时错误,该过程失败。

This article applies to This article does not apply to This article is not tied to any specific product. Not all product versions are identified in this article.

Symptoms

情况说明

启动 Cisco Nexus 交换机升级后,系统会尝试传输固件文件,如以下部署日志中所示:

INFO  [2024-10-08T11:41:43.149490] 315108: provider/base.rb:239:in `process!': Resources for cisconexus5k-fdoXXXXXXX:
 {"asm::firmware"=>
  {"cisconexus5k-fdoXXXXXXX"=>
    {"asm_hostname"=>"10.10.26.16",
     "decrypt"=>false,
     "force_restart"=>true,
     "http_password"=>"test",
     "http_user"=>"test",
     "install_type"=>"uri",
     "path"=>
      "https://test:test@10.10.10.15:443/httpshare/download/8aaa8037910dd23d01910f4a911b159c/nxos64-cs.10.4.2.F.bin",
     "product"=>"cisconexus5k",
     "server_firmware"=>
      "[{\"instance_id\":null,\"component_id\":\"31148\",\"uri_path\":\"https://dellpowerflex.com:443/httpshare/download/8aaa8037910dd23d01910f4a911b159c/nxos64-cs.10.4.2.F.bin\",\"version\":null}]",
     "version"=>"10.4(2)"}}}

 

在此传输过程中,该过程运行约 3-5 分钟,然后停止,导致连接超时。异常日志捕获以下详细信息:

 
#<RuntimeError: env --unset=RUBYOPT --unset=GEM_HOME --unset=RUBYLIB --unset=GEM_PATH --unset=BUNDLE_BIN_PATH RUBYLIB=/opt/service/lib:/opt/asm-deployer/lib:/opt/puppetlabs/puppet/lib:/opt/dependencies/dell-asm-util/lib PATH=/usr/local/sbin:/usr/local/bin:/usr/sbin:/usr/bin:/sbin:/bin:/opt/puppetlabs/puppet/bin:/opt/puppetlabs/bin puppet asm process_node --debug --trace --filename /opt/Dell/ASM/deployments/Job-5c4d4f5b-5fb2-4948-9fe7-8ece57b4b2e7-2/resources/cisconexus5k-fdoXXXXXXX.yaml --run_type apply --statedir /opt/Dell/ASM/deployments/Job-5c4d4f5b-5fb2-4948-9fe7-8ece57b4b2e7-2/resources --always-override cisconexus5k-fdoXXXXXXX failed; output in /opt/Dell/ASM/deployments/Job-5c4d4f5b-5fb2-4948-9fe7-8ece57b4b2e7-2/cisconexus5k-fdoXXXXXXX.out>

 

在此阶段,升级失败,并且 cisconexus5k-fdoXXXXXXX.out 文件显示以下错误:

 
Debug: SSH send only: copy https://test:test@10.10.10.15:443/httpshare/download/8aaa8037910dd23d01910f4a911b159c/nxos64-cs.10.4.2.F.bin bootflash: vrf management
Error: execution expired
Error: /Stage[main]/Asm::Resource_wrapper/Asm::Firmware[cisconexus5k-fdoXXXXXX]/Cisconexus5k_firmwareupdate[firmware_update]/returns: change from  to '#' failed: execution expired

 

影响 

无法使用 PFxM 升级交换机。

Cause

提醒:任何类型的网络中断都可能导致此问题。

使用以下命令对基本网络问题进行故障处理:

 
From Switch:
ping <MVM-MGMT> packet-size 1500 count 1000 vrf management
copy https://X.X.X.X:443/httpshare/download/<PATH> bootflash: vrf management
show vrf
show ip route vrf management
traceroute

 

组件详细信息:

  • Cisco 交换机设备:
    • 接口:mgmt0
    • IP 地址:10.10.26.23/25
    • VRF:Vrf 管理
  • PowerFlex 管理平台主机:
    • 多个网络接口:
    • eth0:10.10.10.23/25(管理网络)
    • eth1:10.10.26.12/25 (OOB)

主要问题是 MVM 上的非对称路由

  • Cisco 交换机和 PFMP 主机的接口在 10.10.26.16/25 子网(OOB 网络)内。
  • 在 PFMP 管理网络上配置路由,以从管理路由到 OOB。
  • 来自 Cisco 交换机 (10.10.26.23) 的文件传输请求使用 eth1 (10.10.26.12) 到达 PFMP1。然后,传出响应从 eth0 (10.10.10.23) 离开。
  • 由于网络配置(包括防火墙设置、安全策略和网络规则),文件传输一直延迟。出现此问题的原因是请求发送到接口 eth1 上的 PFMP1,但响应从 PFMP1 的 eth0 接口路由回交换机,导致连接中断。

Resolution

要解决此问题,应采取以下措施:

禁用 eth1 接口 (NIC):

关闭 PFMP 上的 eth1 接口:

ip link set dev eth1 down

 

从网络配置中删除 eth1:

删除或移动 eth1 的网络配置文件,以防止在重新启动时启动它。

例如,在 Linux 系统上:

mv /etc/sysconfig/network-scripts/ifcfg-eth1 /etc/sysconfig/network-scripts/ifcfg-eth1.bak

Additional Information

受影响的版本

PFMP 4.x

已修复问题的版本

不适用 - 按预期工作

Affected Products

PowerFlex rack RCM Software
Article Properties
Article Number: 000244763
Article Type: Solution
Last Modified: 04 Feb 2025
Version:  2
Find answers to your questions from other Dell users
Support Services
Check if your device is covered by Support Services.