Data Domain:DDOS 版本 7.13、8.1 和 8.2 上的驱动器固件更新问题

Summary: 在 DDOS 版本 7.13、8.1 和 8.2 上,启用了驱动器固件更新的 Data Domain Restorer (DDR) 可能会遇到意外的假磁盘故障。具体而言,由于内核中的 RAID 模块引用计数问题,每个磁盘组 (DG) 的两个设备可能会转换为故障状态。这可能会导致系统不稳定和潜在的数据可用性风险。修复已集成到 DDOS 版本 7.13.1.40、8.3.1.10 及更高版本中。 ...

This article applies to This article does not apply to This article is not tied to any specific product. Not all product versions are identified in this article.

Symptoms

  • 每个设备组 (DG) 两个设备意外进入故障状态
  • 尝试使磁头单元上的第三个设备故障会导致系统死机(Total Fail 状态)
  • 过度 kern.info WARN 日志条目
  • 磁盘组状态降级
  • DDR 上的性能明显下降

受影响的系统:

  • 具有运行早期版本的 DDOS 7.13.x.x 的外部存储的 DD 系统 |8.1.x.x |8.2x.x
    • 修复已向后移植到 >=7.13.1.40
    • 运行 8.1 或 8.2 的客户应更新到 >=8.3.1.10

Cause

在驱动器固件更新过程中,RAID 命令 check scan 可能会根据系统中的设备数量执行多次。每次执行都会增加 RAID 模块在 Linux 内核中的引用计数。在内核版本 5.5(用于 DDOS 7.13、8.1 和 8.2)上,此引用计数不会递减。如果计数滚动到零,内核会阻止 RAID 访问内部 gendisk 结构,导致设备被标记为不可读并移至失败状态。每个 DG 仅可承受两个故障设备;磁头单元上的第三个故障将触发系统死机。

Resolution

以下 DDOS 版本中集成了永久修复:

  • DDOS >=7.13.1.40
  • DDOS >=8.3.1.10

解决办法:

  • 向戴尔技术支持提出服务请求,并引用此知识库文章 (#000331892) 以加快解决速度。
    • 戴尔技术支持:
      • 修改驱动器固件升级脚本以使其在执行后立即返回,从而最大限度地减少 RAID 模块引用计数的增加。

Affected Products

Data Domain
Article Properties
Article Number: 000331892
Article Type: Solution
Last Modified: 10 Dec 2025
Version:  3
Find answers to your questions from other Dell users
Support Services
Check if your device is covered by Support Services.