Data Domain 常规运行状况检查
Summary: 摘要:本文档提供了在 Data Domain (DD) 系统上执行常规运行状况检查时,技术支持可完成的操作。 它包括常规命令和输出,可帮助识别警报或错误配置。
This article applies to
This article does not apply to
This article is not tied to any specific product.
Not all product versions are identified in this article.
Instructions
适用对象:
步骤 1 — 以管理用户身份使用 SSH(例如 PuTTY)连接到 DD 系统。
步骤 2 — 确保文件系统已启用
步骤 3 — 确保 DD 型号支持 DDOS 版本。
文章 81247:DDOS 软件版本
步骤 4— 必须处理任何影响系统运行状况的警报。
步骤 5 — 确保 /data 低于 90%。
为了保持预期的性能水平,Data Domain 建议始终将“use%”保持在 90% 以下。
输出示例:
步骤 6a— 确保没有故障 (F)、正在重建 (R) 或不存在的磁盘 (A)。
输出示例:
步骤 6b:检查磁盘可靠性输出,以查看是否需要主动更换磁盘。
确保没有磁盘的“重新分配扇区”超过 1000 或每天增加
品:35680: Data Domain:SAS 线缆配置、拓扑检查和测试
步骤 8 — 系统配置错误: 如果输出指示一个或多个组件错误,则必须予以解决。
输出示例:
步骤 9 — 如果配置了复制,请检查是否有任何错误。如果存在错误,则必须予以解决。
品:43349: Data Domain — 复制状态
步骤 10 - 如果 VTL 库正在使用中。
品:12128: Data Domain VTL 目标可见性故障处理
步骤 11 — 如果是高可用性系统 (HA)
输出示例:
TSR 日志:
基于戴尔 PowerEdge 的 Data Domain 系统的特殊注意事项(例如:DD6900、DD9400、DD9900、DD3300 和更高版本)
连接到 iDRAC 并检查系统状态和运行状况 — 收集 TSE 日志(如有必要)。
文章 21925:Data Domain:如何收集 TSR 日志。
重新认证请求的最后一步— 最后,重新启动系统,在系统恢复联机状态后,检查当前警报。任何影响系统运行状况的警报都必须予以解决。
如果需要任何进一步的帮助,请向您的支持提供商提出服务请求。
- 所有 Data Domain 操作系统 (DDOS) 版本
- 所有当前型号
步骤 1 — 以管理用户身份使用 SSH(例如 PuTTY)连接到 DD 系统。
步骤 2 — 确保文件系统已启用
# system show serialno # date # filesys status
The filesystem is enabled and running.
步骤 3 — 确保 DD 型号支持 DDOS 版本。
# system show model # system show version
文章 81247:DDOS 软件版本
步骤 4— 必须处理任何影响系统运行状况的警报。
# alerts show current品:14723: Data Domain — 如何检查 Data Domain 系统上的警报。
步骤 5 — 确保 /data 低于 90%。
为了保持预期的性能水平,Data Domain 建议始终将“use%”保持在 90% 以下。
# df
输出示例:
Active Tier: Resource Size GiB Used GiB Avail GiB Use% Cleanable GiB* ---------------- -------- --------- --------- ---- -------------- /data: pre-comp - 7259347.5 - - - /data: post-comp 304690.8 251252.4 53438.5 82% 51616.1 /ddvar 29.5 12.5 15.6 44% - ---------------- -------- --------- --------- ---- --------------文章 54303:Data Domain:如何解决容量问题。
步骤 6a— 确保没有故障 (F)、正在重建 (R) 或不存在的磁盘 (A)。
# disk show state
输出示例:
sysadmin## disk show state Enclosure Disk 1 2 3 4 5 6 7 8 9 10 11 12 13 14 15 16 --------- ------------------------------------------------ 1 . . . . s . . . . . . . 2 . . . . . . . . . A . . . . S R 3 E . . . . . . . . C . . . . . . --------- ------------------------------------------------ Legend State Count ------ ------------ ----- . In Use Disks 25 s Spare Disks 1 R Spare (reconstructing) Disks 1 C Copy Recovery Disks 1 A Absent Disks 1 E Exceeded Error Threshold ------ ------------ -----品:21916: Data Domain — 磁盘状态描述
步骤 6b:检查磁盘可靠性输出,以查看是否需要主动更换磁盘。
确保没有磁盘的“重新分配扇区”超过 1000 或每天增加
# disk show reliability-data输出示例:
Disk Show Reliability-Data -------------------------- Disk ATA Bus Reallocated Temperature (enc/disk) CRC Err Sectors ---------- ------- ----------- ----------- 1.1 0 0 29 C 84 F 1.2 0 0 29 C 84 F 1.3 0 0 29 C 84 F 1.4 0 0 27 C 81 F 2.1 0 0 26 C 79 F 2.2 0 0 25 C 77 F 2.3 0 0 24 C 75 F 2.4 0 0 24 C 75 F 2.5 89 0 25 C 77 F 2.6 0 0 25 C 77 F 2.7 0 3156 24 C 75 F 2.8 0 0 23 C 73 F 2.9 0 0 24 C 75 F 2.10 0 0 24 C 75 F 2.11 0 0 23 C 73 F 2.12 0 0 23 C 73 F 2.13 0 0 25 C 77 F 2.14 0 0 24 C 75 F 2.15 0 0 22 C 72 F 2.16 0 0 22 C 72 F
步骤 7 — 使用连接线缆的端口测试 5 分钟的通信。如果出现错误,建议重新拔插线缆或 LCC。
# enclosure show topology # enclosure test topology port 5 minutes
品:35680: Data Domain:SAS 线缆配置、拓扑检查和测试
步骤 8 — 系统配置错误: 如果输出指示一个或多个组件错误,则必须予以解决。
# enclosure show misconfiguration
输出示例:
Enclosure Show Misconfiguration ------------------------------- Memory Risers: No misconfiguration found. Memory DIMMs: No misconfiguration found. IO Cards: No misconfiguration found. CPUs: No misconfiguration found. Disks: No misconfiguration found.
步骤 9 — 如果配置了复制,请检查是否有任何错误。如果存在错误,则必须予以解决。
# replication status
品:43349: Data Domain — 复制状态
步骤 10 - 如果 VTL 库正在使用中。
# vtl status
品:12128: Data Domain VTL 目标可见性故障处理
步骤 11 — 如果是高可用性系统 (HA)
# ha status
输出示例:
SE@apollo-440-n1-p0(active:0)## ha status HA System name: apollo-440-n1.chaos.local HA System status: highly available Node Name Node id Role HA State ------------------------------- ------- ------- -------- apollo-440-n1-p0.chaos.local 0 active online apollo-440-n1-p1.chaos.local 1 standby online ------------------------------- ------- ------- --------
# ha status detailed输出示例:
SE@apollo-440-n1-p0(active:0)## ha status detailed HA System name: apollo-440-n1.chaos.local HA System Status: highly available Interconnect Status: ok Primary Heartbeat Status: ok External LAN Heartbeat Status: not ok Hardware compatibility check: ok Software Version Check: ok Node apollo-440-n1-p0.chaos.local: Role: active HA State: online Node Health: ok Node apollo-440-n1-p1.chaos.local: Role: standby HA State: online Node Health: ok Mirroring Status: Component Name Status -------------- ------ nvram ok registry ok sms ok ddboost ok cifs ok -------------- ------文章 17861:Data Domain HA (DDHA) 设备的运行状况检查
TSR 日志:
基于戴尔 PowerEdge 的 Data Domain 系统的特殊注意事项(例如:DD6900、DD9400、DD9900、DD3300 和更高版本)
连接到 iDRAC 并检查系统状态和运行状况 — 收集 TSE 日志(如有必要)。
文章 21925:Data Domain:如何收集 TSR 日志。
重新认证请求的最后一步— 最后,重新启动系统,在系统恢复联机状态后,检查当前警报。任何影响系统运行状况的警报都必须予以解决。
如果需要任何进一步的帮助,请向您的支持提供商提出服务请求。
Additional Information
请观看此视频:
Affected Products
Data DomainProducts
Data Domain, Data Domain, Data Domain Deduplication Storage Systems, Data Domain Replicator, DD OS, DD6300 Appliance, DD6800 Appliance, DD6900 Appliance, DD7200 Appliance, DD9300 Appliance, DD9400 Appliance, DD9800 Appliance, DD9900 ApplianceArticle Properties
Article Number: 000197930
Article Type: How To
Last Modified: 16 Sept 2025
Version: 7
Find answers to your questions from other Dell users
Support Services
Check if your device is covered by Support Services.