Data Domain:为用户对接口关闭或连接时断时续等问题进行故障处理

Summary: 本文的主要重点是对单个接口关闭、多个接口关闭、接口连接时断时续和网卡损坏进行故障处理。更换部件应该是解决接口关闭问题的最后一步。先对查看交换机端之类的问题进行故障处理,有可能会最快解决问题。

This article applies to This article does not apply to This article is not tied to any specific product. Not all product versions are identified in this article.

Instructions

故障处理:
  1. 确定问题是出在单个接口、多个接口、接口连接时断时续,还是出在网卡。
    1. 确定是接口已关闭、连接时断时续、无响应,还是网卡有问题。
    2. 链路状态“No”是指接口没有电信号,处于关闭状态。
    3. 时断时续是指发生的时间间隔不规则;不连续或不稳定。
    4. 要检查 Data Domain 上硬件接口的状态,请运行以下命令。
      # net show hardware
    5. 要检查当前警报,请运行以下命令。
      # alerts show current
    6. 要检查警报的历史记录,请运行以下命令。
      # alerts show history
    7. 检查 net show 设置,查看已关闭的接口是否是虚拟绑定、vlan 或别名的一部分。
      # net show settings
      提醒:为了使接口具有链路指示灯并能够运行,必须通过 ip 或在绑定中对其进行配置。
    8. 如果在 DDOS 升级后接口关闭,则它是硬件故障所致的可能性很小。
      1. 如果已关闭的接口不在绑定中,则您可以使用以下命令禁用该接口,然后再将其启用。
# net disable ethXx

# net enable ethXx
  1. 强烈推荐您在向戴尔支持部门提交案例之前,先与网络团队联系,以核实交换机配置。
    1. 在升级过程中,接口会断开与网络的连接,而交换机有时会在没有收到来自 dd 接口的响应后超时,并禁用其端口。
    2. 如果交换机端口已超时和禁用,则 Data Domain 支持人员无法帮助修复此问题,您必须联系网络团队以启用这些端口。
  2. 如果您在数据中心有现场人员,则让现场工程师到现场,从 dd 端和配线架或交换机端重新拔插 SFP 或线缆。
  3. 如果您在 Data Domain 上配置了新接口,但它没有开启并运行,则检查以确保有线缆连接到配线架或交换机端。
  4. 如果您首次设置 Data Domain,而接口没有开启并运行,那么除了速度设置之外,请确保交换机端的端口配置正确无误。
    1. 对于 Data Domain 上的 10g 接口,交换机也应设置为 10g 速度。
    2. 对于 Data Domain 上的 1g 速度,如果交换机设置为 10g,则会无法正常工作,它可能与交换机上的自动协商更加兼容。
  5. 如果您首次设置带有光纤或 DA 铜质接口的 Data Domain,请确保具有兼容的 SFP 和线缆。
  6. 如果在重新启动或系统升级后,当前警报报告“MissingSlave”且接口关闭,请再次重新启动 Data Domain。
    示例
    p0-96 Tue Oct 24 16:47:52 2023 CRITICAL Network MissingSlave=veth0_eth1a EVT-NETM-00012: Network interface eth1a is missing. This is a physical interface for veth0.
    1. 这个问题要么是硬件故障,要么是某些组件和层以不正确顺序联机的争用情况导致的错误警报。
    2. 如果第二次重新启动后,“MissingSlave”警报未清除,并且接口仍处于关闭状态,请向 Data Domain 硬件支持部门提交案例。
  7. 要检索已安装的网卡类型的输出,请运行以下命令:
# system show hardware

# enclosure show io-cards
  1. 要查看过去的自动支持以便与当前状态进行比较,请登录到 UI,然后转至“Maintenance”>“Support”>“Autosupport reports”。
    在那里,会看到过去的 14 个自动支持报告,您可将其下载并用 notepad ++ 打开
  2. 如果接口突然关闭,并且这不是重新启动或升级造成的,那么有可能是线缆或 SFP 坏了。
    提醒:戴尔硬件支持部门不会更换客户的配线架交换机端的线缆与 SFP。数据中心这一端的线缆与 SFP 更换是客户数据中心的责任。
    1. 请联系您的数据中心人员,重新拔插线缆或 SFP。
    2. 如果重新拔插后链路指示灯仍不亮起,请让数据中心更换交换机端的线缆与光纤 SFP。
    3. 如果要更换线缆与光纤 SFP,请让数据中心检查配线架或交换机上的端口,然后尝试使用其他端口。
    4. 如果所有步骤均已执行,但接口仍然没有开启并运行,请提交戴尔硬件案例,以便更换 dd 端的 SFP。
  3. 已关闭的接口是虚拟绑定的一部分时的故障处理步骤。
    1. 如果在升级或重新启动后接口没有开启,请与网络团队联系,对交换机端口这一端进行检查,以尝试禁用和启用端口。
    2. 如果网络团队检查了交换机端口,并已禁用和启用该端口,那么您也可以在 Data Domain 端进行尝试。
  4. 在 Data Domain 端,您可以使用以下命令禁用并重新启用虚拟绑定。
# net disable vethXx

# net enable vethXx
提醒:禁用接口或整个绑定时,请小心谨慎,您必须始终确保具有冗余,并且通过 SSH 连接到该绑定之外的另一个连接。如果您在禁用和启用虚拟绑定时感到不安,或者虚拟绑定是您与 Data Domain 的唯一连接,请勿继续操作。
  1. 您可以从绑定中删除接口,然后将其添加回到绑定中。这可以通过 UI 或命令行来完成。
LACP 绑定时的示例
#net aggregate del vethX interface ethXx

#net aggregate add vethX interface ethXx
 
故障切换绑定时的示例
#net failover del vethX interfaces ethXx

#net failover add vethX interfaces ethXx
  1. 如果删除和添加接口无法解决问题,请尝试销毁虚拟绑定并重新创建它。
    提醒:销毁整个绑定时,请小心谨慎,您必须始终确保具有冗余,并且通过 ssh 连接到该绑定之外的另一个连接。
    如果您在销毁虚拟绑定时感到不安,并且它是您与 Data Domain 的唯一连接,请勿继续操作。
    这可以通过 UI 来完成,此方式相对来说更加容易。
    Data Domain - 使用图形用户界面 (UI) 配置物理接口
  2. 如果销毁并重新创建虚拟绑定无法使接口开启,请再次销毁虚拟绑定,然后将 IP 地址分配给接口。
    如果将 IP 地址分配给接口后该接口开启并运行,那么很可能是交换机端配置不正确,这超出了 Data Domain 支持人员的范围,因此您最好与网络团队进行联系。
  3. 接口仍处于关闭状态时的故障处理步骤。
    1. 请联系您的数据中心人员,重新拔插线缆或 SFP。
    2. 如果重新拔插后链路指示灯仍不亮起,请让数据中心更换交换机端的线缆与光纤 SFP。
    3. 如果要更换线缆与光纤 SFP,请让数据中心检查配线架或交换机上的端口,然后尝试使用其他端口。
    4. 如果所有步骤均已执行,但接口仍然没有开启并运行,请提交戴尔硬件案例,以便更换 dd 端的 SFP。
      提醒:戴尔硬件支持部门不会更换客户的配线架交换机端的线缆与 SFP。数据中心这一端的线缆与 SFP 更换是客户数据中心的责任。
  4. 如果您在数据中心有现场人员,那么以下是现场人员解决问题所采取的故障处理步骤。
    1. 验证线缆是否已牢固连接在 Data Domain 与交换机端口或配线架端口之间。
      1. 如果可能,请跟踪线缆,确保其连接到 Data Domain 背面的正确端口。
    2. 验证交换机端口或配线架端口上是否有链路指示灯。
    3. 如果 Data Domain 端口上没有链路指示灯,请重新拔插线缆。
    4. 如果配线架端口或交换机端口的背面没有链路指示灯,请重新拔插线缆。
    5. 如果在 Data Domain 端以及配线架端口或交换机端口这一端重新拔插线缆后没有链路指示灯,请更换线缆。
    6. 如果现场人员在现场,您还可以指示他们在 Data Domain 上已关闭的接口端口换上正常工作的接口线缆。
      在现场人员交换线缆后,他们应该会看到链接指示灯,并且在 Data Domain 上,net show hardware 应该将链路显示为“yes”。
      # net show hardware
    7. 如果交换线缆后链路指示灯亮起,则问题一定是 Data Domain 上的 SFP 损坏、交换机端上的线缆或 SFP 损坏或者配线架交换机端上的端口损坏。
    8. 数据中心人员的另一个故障处理步骤是执行环回测试。
      1. 如果 Data Domain 上有相同类型的空闲未配置接口,您可将其从一个接口连接到另一个接口,以形成环路。
        例如,如果 eth1a 是铜质接口,而 eth4a 也是铜质接口,但尚未使用,则将 eth1a 连接到 eth4a。
        eth4a 必须配置有虚拟 IP 地址,您可以在其中输入任何内容,例如
        # net config eth4a 1.2.3.4 netmask 255.255.255.0
        
        完成环回测试后,清除虚拟 IP 的配置
        # net config eth4a 0.0.0.0
      2. 如果环回测试无法正常工作,并且 SFP 和/或线缆均已更换,则向 Data Domain 硬件支持团队提交案例。
  5. 对物理光纤接口和直连型铜质接口进行故障处理。

    下面的示例可能看起来与您的输出不完全相同。

    物理光纤接口的输出示例。

    	sysadmin@dd3300-ddsupport# net show hardware
    	  Port    Speed      Duplex    Supp Speeds   Hardware Address    Physical   Link Status   State     Autonegotiation
    	  -----   --------   -------   -----------   -----------------   --------   -----------   -------   ---------------
    	  eth1b   unknown    unknown   1000/10000    00:0c:29:46:fc:1b   Fiber      no            up        on
    	  -----   --------   -------   -----------   -----------------   --------   -----------   -------   ---------------


    物理 DA 铜质接口的输出示例。

    	sysadmin@ddsupport# net show hardware
    	Net Show Hardware
    	-----------------
    	Port Speed Duplex Supp Speeds Hardware Address       Physical     Link   Status    
    	----- ------- ------- ----------- ----------------- --------- ----------- -------
    	eth8a unknown unknown  25000  34:80:0d:94:70:52     DA Copper  no        up
    	----- ------- ------- ----------- ----------------- --------- ----------- -------

    在大多数客户环境中,光纤接口有三个组件;Data Domain 端上的 SFP、光缆以及客户配线架或交换机端上的 SFP。

    但是,以一些客户为例,他们将 Data Domain 连接到配线架,然后用分支线缆连接到 QSFP,而 QSFP 还有其他连接。

    有时,您必须询问客户的连接情况,因为有时从 Data Domain 连接到配线架或交换机端可能不是问题,但之后的其他组件或连接可能会影响该接口。

  6. 如果升级后生成警报,指示接口上存在速度不匹配的情况,请查看以下信息。

    示例

    	Id Post Time Severity Class Object Message
    	------ ------------------------ -------- ------- ----------------------------- --------------------------------------------------------------------------------
    	p0-618 Tue Oct 20 09:50:53 2023 CRITICAL Network Bonded Interface Name=veth1 EVT-NETM-00015: One or more interfaces in the bonded group has a speed mismatch.
    	------ ------------------------ -------- ------- ----------------------------- --------------------------------------------------------------------------------

    这可能意味着,绑定中一个接口的速度设置为 100 mbs,而另一个接口的速度设置为 1000 mbs。

    出现这种情况有多种原因,它们可能与 Data Domain 无关。

    • 以太网线缆出现故障
    • 配线架或交换机端上的端口出现故障
    • 交换机端口配置限制了速度。
    • 交换机速度有限制。
    • 虚拟绑定中的接口不是正确的接口。
    • 接口连接到错误的交换机或交换机端口。

      以下是您进一步故障处理所能执行的操作。

      这些步骤也可以通过 UI 来完成。
      Data Domain - 使用图形用户界面 (UI) 配置物理接口

      1. 要检查 Data Domain 上硬件接口的状态,请运行以下命令
        # net show hardware
      2. 要检查当前警报,请运行以下命令
        # alerts show current
      3. 检查 net show 设置,查看已关闭的接口是否是虚拟 VLAN 或别名的一部分。
        # net show settings
      4. 如果在 DDOS 升级后接口关闭,则它是硬件故障所致的可能性很小。
# net disable ethXx

# net enable ethXx
  1. 接口以前可能不匹配,但现在警报只有在升级或重新启动后才会发出,您可以查看历史记录
# alerts show history
  1. 与网络团队联系,对交换机配置进行检查,并重新配置交换机速度或重新配置自动协商。
  2. 禁用并启用交换机端口。
  3. 如果正在使用 LACP,请在自动支持报告中查看 LLDP 信息,了解正确的接口是否在 LACP 绑定中。
  4. 从绑定中删除接口
    # net failover del vethX interfaces ethXx
  5. 使用虚拟 IP 地址配置接口
    # net config ethXx 1.2.3.4 netmask 255.255.255.0
  6. 尝试手动更改速度
    提醒:根据接口和 Data Domain 型号,您无法设置速度。
    #net config ethXx duplex full speed 1000
  7. 在尝试上述步骤以清除虚拟 IP 后,请运行以下命令。
    #net config ethXx 0.0.0.0
  8. 将它添加回绑定中
    # net failover add vethX interfaces ethXx
  9. 如果问题仍未解决,我们推荐您更换线缆并再次检查交换机端。


系统上的物理接口可能宕机的原因的列表:
从硬件问题到网络问题,系统上的物理接口可能会因为各种原因而宕机。以下是常见原因的列表:

  • 物理线缆断开连接:将接口连接到网络或另一设备的线缆可能在物理上断开连接,导致接口宕机。
  • 接口错误:线缆连接到 Data Domain 端上的错误接口。
  • 接口错误:线缆连接到配线架和交换机端上的错误接口。
  • 硬件故障:网络接口卡 (NIC)、交换机、路由器或线缆等故障硬件组件可能会导致接口停机。
  • 电源问题:网络设备的电源波动、断电或电源不足都可能会导致接口宕机。
  • 过热:过热可能会损坏硬件组件,导致接口故障和系统关机。
  • 网络拥塞:大量网络流量或高度拥塞可能会使接口不堪重负,导致其变得无响应或宕机。
  • 软件错误:设备驱动程序、固件或操作系统中的问题、小故障或不兼容问题可能会导致接口故障。
  • 配置错误:不正确的网络配置(如 IP 地址冲突或不正确的子网掩码)可能会导致接口无法访问。
  • 安全措施:安全策略(如入侵检测或防火墙规则)可能会无意中阻止或限制通过接口的流量。
  • 物理损坏:硬件的物理损坏(例如进水、撞击或磨损)都可能导致接口故障。
  • 环境因素:极端温度、湿度、灰尘或其他环境因素可能会影响硬件的功能,并导致接口宕机。
  • 固件或软件更新:错误应用的固件或软件更新可能会导致不稳定并引起接口故障。
  • 网络攻击:拒绝服务 (DoS) 攻击、分布式拒绝服务 (DDoS) 攻击或其他恶意活动可能会使接口过载并导致其出现故障。
  • 路由问题:不正确的路由表条目或动态路由协议的问题可能会中断通过接口的连接。
  • 物理接口配置:不正确的速度和双工设置、自动协商问题或连接设备之间不匹配的配置可能会导致接口停机。
  • 线缆质量:质量较差或受损的线缆可能会导致连接时断时续或接口彻底故障。
  • 交换机或路由器故障:连接到接口的交换机或路由器等网络设备中的故障可能会导致下游接口问题。
  • 网络提供商问题:如果系统连接到外部网络提供商,则其终端方面的相关问题(维护、中断、配置错误)可能会导致接口宕机。
  • 资源耗尽:系统内存或处理能力不足可能会导致接口故障,尤其是在高流量情况下,情况更是如此。
  • 物理端口禁用:管理员、网络管理系统或安全策略禁用物理端口的手动或自动操作。
  • 光纤信号丢失:在光纤连接中,弯曲、污染或断裂引起的信号丢失等问题可能会导致接口宕机。

Data Domain - 使用图形用户界面 (UI) 配置物理接口
Data Domain - 通过命令行界面 (CLI) 配置物理接口

Additional Information

请参阅此视频:

Data Domain 网络接口故障处理

持续时间:00:03:07 (hh:mm:ss)
如果可用,可以使用此视频播放器上的 CC 图标选择隐藏式字幕(字幕)语言设置。

您也可以在 YouTube 上观看此视频。

Affected Products

Data Domain
Article Properties
Article Number: 000219757
Article Type: How To
Last Modified: 30 Sept 2025
Version:  3
Find answers to your questions from other Dell users
Support Services
Check if your device is covered by Support Services.