Data Domain:DDOS 7.x 上的驱动器固件更新问题 |8.0 |8,1|8,2 |8.3.0.x

摘要: 在启用了驱动器固件更新的 DDOS 版本 7.10、7.13、8.0、8.1、8.2、8.3.0.x Data Domain (DD) 系统上,可能会遇到意外的假磁盘故障。具体而言,由于内核中的 RAID 模块引用计数问题,每个磁盘组 (DG) 的两个设备可能会转换为故障状态。这可能会导致系统不稳定和潜在的数据可用性风险。

本文适用于 本文不适用于 本文并非针对某种特定的产品。 本文并非包含所有产品版本。

症状

  • 每个设备组 (DG) 两个设备意外进入故障状态
  • 尝试使磁头单元上的第三个设备故障会导致系统死机(Total Fail 状态)
  • 过度 kern.info WARN 日志条目
  • 磁盘组状态降级
  • DD 上的性能明显下降

受影响的系统:

  • 具有运行早期版本 DDOS 7.10 的外部存储的 DD 系统 |7.13 |8.0 |8.1 |8,2 |8.3.0.x

原因

在驱动器固件更新过程中,RAID 命令 check scan 可能会根据系统中的设备数量执行多次。每次执行都会增加 RAID 模块在 Linux 内核中的引用计数。在内核版本 4.4 和 5.4(用于 DDOS 7.7、7.10、7.13、8.0、8.1、8.2 和 8.3.0.x)上,此引用计数不会递减。如果计数滚动到零,内核会阻止 RAID 访问内部 gendisk 结构,导致设备被标记为不可读并移至失败状态。每个 DG 仅可承受两个故障设备;第三个故障会触发机头单元(控制器)上的系统死机。

解决方案

以下 DDOS 版本中集成了永久修复:

  • LTS 版本: 
    • 7.10.1.70 || 7.13.1.30 ||8.3.1.0(或更高版本)
  • 功能版本:
    • >= 8.4.0.x

解决办法:

  • 如果无法升级。
  • 由戴尔技术支持完成:
    • 修改驱动器固件升级脚本以使其在执行后立即返回,从而最大限度地减少 RAID 模块引用计数的增加。
  • 客户:向戴尔技术支持提出服务请求,并引用此知识库文章 (#000331892) 以加快解决速度。

受影响的产品

Data Domain
文章属性
文章编号: 000331892
文章类型: Solution
上次修改时间: 07 1月 2026
版本:  6
从其他戴尔用户那里查找问题的答案
支持服务
检查您的设备是否在支持服务涵盖的范围内。