Data Domain:如何执行常规运行状况检查

摘要: 摘要:本文档提供了在 Data Domain (DD) 系统上执行常规运行状况检查时,技术支持可完成的作。 它包括常规命令和输出,可帮助识别警报或错误配置。

本文适用于 本文不适用于 本文并非针对某种特定的产品。 本文并非包含所有产品版本。

说明

适用对象:

  • 所有 Data Domain作系统 (DDOS) 版本
  • 所有当前型号 
提醒:Data Domain 建议使用内置的“运行状况检查”命令
  • # support healthcheck hardware
  • # system health check

手动 12 步运行状况检查:

  1. 以管理用户身份使用 SSH(例如 PuTTY)连接到 DD 系统。
  2. 检查文件系统是否已启用。
    • # system show serialno
      # date
      # filesys status
      The filesystem is enabled and running.
  3. 检查正在运行的 DDOS 版本是否为当前版本,并且该 DD 型号支持该版本。
  4.  解决影响系统运行状况的任何活动警报
  5. 确保 /data 低于 90%。
    • 为了保持预期的性能水平,Data Domain 建议将“use%”保持在 90% 以下。
    • # df
      • 示例输出:
        • Active Tier:
          Resource           Size GiB    Used GiB   Avail GiB   Use%   Cleanable GiB*
          ----------------   --------   ---------   ---------   ----   --------------
          /data: pre-comp           -   7259347.5           -      -                -
          /data: post-comp   304690.8    251252.4     53438.5    82%           51616.1 
          /ddvar                 29.5        12.5        15.6    44%                -
          ----------------   --------   ---------   ---------   ----   --------------
    • 参考:Data Domain:如何解决容量问题 
  6. 验证磁盘的状态: 
    1. # disk show state
      • 不应有 故障 (F)、错误 (E)、缺失磁盘 (A) 或正在重建 (R) 磁盘
        • 所有磁盘都必须是“正在使用中”或“备用”
      • 示例输出:
        • sysadmin## disk show state
          Enclosure   Disk
                      1  2  3  4  5  6  7  8  9  10 11 12 13 14 15 16
          ---------   ------------------------------------------------
          1           .  .  .  .  s  .  .  .  .  .  .  .
          2           .  .  .  .  .  .  .  .  .  A  .  .  .  .  S  R
          3           E  .  .  .  .  .  .  .  .  C  .  .  .  .  .  .
          ---------   ------------------------------------------------
          Legend   State          Count
          ------   ------------   -----
          .        In Use Disks   25
          s        Spare Disks    1
          R        Spare (reconstructing) Disks 1
          C        Copy Recovery Disks 1
          A        Absent Disks   1
          E        Exceeded Error Threshold
          ------   ------------   -----
        • 参考:Data Domain:如何识别和解决磁盘状态
    2. 检查磁盘可靠性输出,以查看是否需要主动更换磁盘。
      • 确保没有磁盘的“重新分配扇区”超过 1000 或每天增加。
      • # disk show reliability-data
        • 示例输出:
        • Disk Show Reliability-Data
          --------------------------
          Disk         ATA Bus   Reallocated   Temperature
           (enc/disk)   CRC Err   Sectors
          ----------   -------   -----------   -----------
          1.1          0         0             29 C   84 F
          1.2          0         0             29 C   84 F
          1.3          0         0             29 C   84 F
          1.4          0         0             27 C   81 F
          2.1          0         0             26 C   79 F
          2.2          0         0             25 C   77 F
          2.3          0         0             24 C   75 F
          2.4          0         0             24 C   75 F
          2.5         89         0             25 C   77 F
          2.6          0         0             25 C   77 F
          2.7          0         3156          24 C   75 F
          2.8          0         0             23 C   73 F
          2.9          0         0             24 C   75 F
          2.10         0         0             24 C   75 F
          2.11         0         0             23 C   73 F
          2.12         0         0             23 C   73 F
          2.13         0         0             25 C   77 F
          2.14         0         0             24 C   75 F
          2.15         0         0             22 C   72 F
          2.16         0         0             22 C   72 F
  7. 在连接的 SAS 端口上测试 SAS/后端存储通信 5 分钟。
  8. 解决任何报告的错误配置:
    • # enclosure show misconfiguration
      • 示例输出:
      • Enclosure Show Misconfiguration
        -------------------------------
        Memory Risers:
            No misconfiguration found.
        Memory DIMMs:
            No misconfiguration found.
        IO Cards:
            No misconfiguration found.
        CPUs:
            No misconfiguration found.
        Disks:
            No misconfiguration found.
  9. 检查是否有与复制相关的任何错误(如果已配置)
  10. 检查并确认 VTL 的状态(如果已配置)管理此进程:
  11. 检查并确认高可用性 (HA) 的状态 — 如果已配置:
  12. 如果可用,请运行硬件和系统运行状况检查
    • # support healthcheck hardware
      # system health check
    • 相应地解决任何问题。
    • 示例输出:
      • HARDWARE Health Check Summary:
        +-------------------+--------+
        | Component         | Status |
        +-------------------+--------+
        | Storage Disk      | PASS   |
        | Power-Supply Unit | PASS   |
        | FAN               | PASS   |
        | SAS Controller    | PASS   |
        | QAT               | PASS   |
        | NvRAM             | PASS   |
        | DIMMs             | PASS   |
        | IO Cards          | PASS   |
        | CPU               | PASS   |
        | NIC H/W Errors    | PASS   |
        +-------------------+--------+
      • 基于 PowerEdge 的 Data Domain 系统(例如:DD6400、6900、9910)系统还可以连接到 iDRAC 以检查系统硬件状态:

在所有运行状况检查情况下,完成上述步骤后,重新启动 DD 系统。

  • # system reboot

系统重新启动后,请检查:

  • # alerts show current 
    • 不应有新的或未完成的警报
  • # filesys status
    • 文件系统应已启用并正在运行。

 


如果需要进一步的帮助,请向您的签约支持提供商提出服务请求。

其他信息

请观看此视频:
 

受影响的产品

Data Domain

产品

Data Domain, Data Domain, Data Domain Deduplication Storage Systems, Data Domain Replicator, DD OS, DD6300 Appliance, DD6800 Appliance, DD6900 Appliance, DD7200 Appliance, DD9300 Appliance, DD9400 Appliance, DD9800 Appliance, DD9900 Appliance
文章属性
文章编号: 000197930
文章类型: How To
上次修改时间: 23 1月 2026
版本:  9
从其他戴尔用户那里查找问题的答案
支持服务
检查您的设备是否在支持服务涵盖的范围内。