Data Domain 常规运行状况检查

Summary: 摘要:本文档提供了在 Data Domain (DD) 系统上执行常规运行状况检查时,技术支持可完成的操作。 它包括常规命令和输出,可帮助识别警报或错误配置。

This article applies to This article does not apply to This article is not tied to any specific product. Not all product versions are identified in this article.

Instructions

适用对象:
  • 所有 Data Domain 操作系统 (DDOS) 版本
  • 所有当前型号 

步骤 1 — 以管理用户身份使用 SSH(例如 PuTTY)连接到 DD 系统。

步骤 2 — 确保文件系统已启用
# system show serialno
# date
# filesys status
The filesystem is enabled and running.

步骤 3 — 确保 DD 型号支持 DDOS 版本。
# system show model
# system show version

文章 81247:DDOS 软件版本

步骤 4— 必须处理任何影响系统运行状况的警报。
# alerts show current
品:14723: Data Domain — 如何检查 Data Domain 系统上的警报。

步骤 5 — 确保 /data 低于 90%。
为了保持预期的性能水平,Data Domain 建议始终将“use%”保持在 90% 以下。
# df

输出示例:
Active Tier:
Resource           Size GiB    Used GiB   Avail GiB   Use%   Cleanable GiB*
----------------   --------   ---------   ---------   ----   --------------
/data: pre-comp           -   7259347.5           -      -                -
/data: post-comp   304690.8    251252.4     53438.5    82%           51616.1 
/ddvar                 29.5        12.5        15.6    44%                -
----------------   --------   ---------   ---------   ----   --------------
文章 54303:Data Domain:如何解决容量问题。
 


步骤 6a— 确保没有故障 (F)、正在重建 (R) 或不存在的磁盘 (A)。
# disk show state

输出示例:
sysadmin## disk show state
Enclosure   Disk
            1  2  3  4  5  6  7  8  9  10 11 12 13 14 15 16
---------   ------------------------------------------------
1           .  .  .  .  s  .  .  .  .  .  .  .
2           .  .  .  .  .  .  .  .  .  A  .  .  .  .  S  R
3           E  .  .  .  .  .  .  .  .  C  .  .  .  .  .  .
---------   ------------------------------------------------
Legend   State          Count
------   ------------   -----
.        In Use Disks   25
s        Spare Disks    1
R        Spare (reconstructing) Disks 1
C        Copy Recovery Disks 1
A        Absent Disks   1
E        Exceeded Error Threshold
------   ------------   -----
品:21916: Data Domain — 磁盘状态描述

步骤 6b:检查磁盘可靠性输出,以查看是否需要主动更换磁盘。
确保没有磁盘的“重新分配扇区”超过 1000 或每天增加
# disk show reliability-data
输出示例:
Disk Show Reliability-Data
--------------------------
Disk         ATA Bus   Reallocated   Temperature
 (enc/disk)   CRC Err   Sectors
----------   -------   -----------   -----------
1.1          0         0             29 C   84 F
1.2          0         0             29 C   84 F
1.3          0         0             29 C   84 F
1.4          0         0             27 C   81 F
2.1          0         0             26 C   79 F
2.2          0         0             25 C   77 F
2.3          0         0             24 C   75 F
2.4          0         0             24 C   75 F
2.5         89         0             25 C   77 F
2.6          0         0             25 C   77 F
2.7          0         3156          24 C   75 F
2.8          0         0             23 C   73 F
2.9          0         0             24 C   75 F
2.10         0         0             24 C   75 F
2.11         0         0             23 C   73 F
2.12         0         0             23 C   73 F
2.13         0         0             25 C   77 F
2.14         0         0             24 C   75 F
2.15         0         0             22 C   72 F
2.16         0         0             22 C   72 F
 
步骤 7 — 使用连接线缆的端口测试 5 分钟的通信。如果出现错误,建议重新拔插线缆或 LCC。
# enclosure show topology
# enclosure test topology port 5 minutes

品:35680: Data Domain:SAS 线缆配置、拓扑检查和测试

步骤 8 — 系统配置错误: 如果输出指示一个或多个组件错误,则必须予以解决。
# enclosure show misconfiguration

输出示例:
Enclosure Show Misconfiguration
-------------------------------
Memory Risers:
    No misconfiguration found.
Memory DIMMs:
    No misconfiguration found.
IO Cards:
    No misconfiguration found.
CPUs:
    No misconfiguration found.
Disks:
    No misconfiguration found.
 
 


步骤 9 — 如果配置了复制,请检查是否有任何错误。如果存在错误,则必须予以解决。
# replication status

品:43349:  Data Domain — 复制状态

步骤 10 - 如果 VTL 库正在使用中。
# vtl status

品:12128: Data Domain VTL 目标可见性故障处理

步骤 11 — 如果是高可用性系统 (HA)
# ha status

输出示例:
SE@apollo-440-n1-p0(active:0)## ha status
HA System name: apollo-440-n1.chaos.local
HA System status: highly available
 
Node Name                         Node id   Role      HA State
-------------------------------   -------   -------   --------
apollo-440-n1-p0.chaos.local   0         active    online
apollo-440-n1-p1.chaos.local   1         standby   online
-------------------------------   -------   -------   --------
# ha status detailed
输出示例:
SE@apollo-440-n1-p0(active:0)## ha status detailed
HA System name: apollo-440-n1.chaos.local
HA System Status: highly available
Interconnect Status: ok
Primary Heartbeat Status:  ok
External LAN Heartbeat Status: not ok
Hardware compatibility check: ok
Software Version Check:   ok
 
Node apollo-440-n1-p0.chaos.local:
        Role:      active
        HA State:  online
        Node Health: ok
 
Node apollo-440-n1-p1.chaos.local:
        Role:     standby
        HA State: online
        Node Health: ok
 
Mirroring Status:
Component Name   Status
--------------   ------
nvram            ok
registry         ok
sms              ok
ddboost          ok
cifs             ok
--------------   ------
文章 17861:Data Domain HA (DDHA) 设备的运行状况检查 
 


TSR 日志:
基于戴尔 PowerEdge 的 Data Domain 系统的特殊注意事项(例如:DD6900、DD9400、DD9900、DD3300 和更高版本)
连接到 iDRAC 并检查系统状态和运行状况 — 收集 TSE 日志(如有必要)。

文章 21925:Data Domain:如何收集 TSR 日志。

重新认证请求的最后一步— 最后,重新启动系统,在系统恢复联机状态后,检查当前警报。任何影响系统运行状况的警报都必须予以解决。

如果需要任何进一步的帮助,请向您的支持提供商提出服务请求。

Additional Information

请观看此视频:
 

Affected Products

Data Domain

Products

Data Domain, Data Domain, Data Domain Deduplication Storage Systems, Data Domain Replicator, DD OS, DD6300 Appliance, DD6800 Appliance, DD6900 Appliance, DD7200 Appliance, DD9300 Appliance, DD9400 Appliance, DD9800 Appliance, DD9900 Appliance
Article Properties
Article Number: 000197930
Article Type: How To
Last Modified: 16 Sep 2025
Version:  7
Find answers to your questions from other Dell users
Support Services
Check if your device is covered by Support Services.