PowerScale:NDMP 性能故障处理
摘要: 在调查 PowerScale 群集上的 Network Data Management Protocol (NDMP) 性能问题时,需要在一些关键方面进行调查以了解可能的原因。
本文适用于
本文不适用于
本文并非针对某种特定的产品。
本文并非包含所有产品版本。
说明
在较新版本的 OneFS 9.x.x 中,对 NDMP 进行了多项性能增强。验证群集的版本和已安装的 RUP,以确保应用最新的改进。
应通过分析三个关键系统资源来评估 NDMP 性能:
- CPU 利用率
- 磁盘 I/O
- 网络基础架构
CPU 性能分析
对于报告运行缓慢的每个节点,请检查 isi_hw_status 和 top 输出。
- 识别虚拟核心
从 isi_hw_status,计算虚拟核心数:
Virtual Cores = CPUs × Cores per CPU × 2 (if Hyperthreading is enabled)
示例:
PROC: Single-proc, Dual-HT-core → 1 × 2 × 2 = 4 virtual cores
- 检查负载平均值
从 top 输出,查看 1、3 和 5 分钟负载平均值:
load averages: 4.71, 3.48, 3.09
如果 负载平均值 超过 虚拟核心数,则 CPU 负载可能是导致 NDMP 性能问题的因素。建议减少活动进程的数量或将负载重新分发到使用不频繁的节点。
磁盘性能分析
步骤:
- 查看驱动器统计信息
对于报告运行缓慢的每个节点,请检查 isi statistics drive,然后检查 “队列 ”列。值:
- > 1.0 表示排队
- > 1.5 提示性能显著下降
示例:
Queued: 2.3 → High I/O wait on the spindle
- 检查存储利用率
确保磁盘利用率低于 90%。高利用率会加剧性能问题。
示例:
Used: 63.2% <-- Within acceptable range
- 建议
如果队列数量较多,请减少 I/O 负载、重新分发备份或扩展资源。
网络性能分析(仅限三向 NDMP)
步骤:
- 识别 NDMP 连接
在 netstat 输出,找到 NDMP CONTROL 连接(端口 10000)并标识相应的 DATA 连接(通常列在其上方)。
示例:
tcp4 0 384563 172.19.220.31.23261 172.19.200.22.55621 ESTABLISHED ← DATA tcp4 0 0 172.17.2.91.10000 172.19.200.22.55424 ESTABLISHED ← CONTROL
- 分析 Send-Q
高且稳定的 Send-Q(例如, 六位数 值)表示正在发送数据但未确认,这表明存在瓶颈。
- 检查备份服务器
在备份服务器上,检查 Recv-Q.较高的值意味着数据管理应用程序 (DMA) 不堪重负。
- 建议
如果数据管理应用程序 (DMA) 是瓶颈,建议联系 DMA 支持团队以获得进一步的帮助。
受影响的产品
Isilon, PowerScale OneFS产品
Isilon Backup Accelerator文章属性
文章编号: 000187297
文章类型: How To
上次修改时间: 20 8月 2025
版本: 6
从其他戴尔用户那里查找问题的答案
支持服务
检查您的设备是否在支持服务涵盖的范围内。