PowerScale:NDMP 性能故障处理
Summary: 在调查 PowerScale 群集上的 Network Data Management Protocol (NDMP) 性能问题时,需要在一些关键方面进行调查以了解可能的原因。
This article applies to
This article does not apply to
This article is not tied to any specific product.
Not all product versions are identified in this article.
Instructions
在较新版本的 OneFS 9.x.x 中,对 NDMP 进行了多项性能增强。验证群集的版本和已安装的 RUP,以确保应用最新的改进。
应通过分析三个关键系统资源来评估 NDMP 性能:
- CPU 利用率
- 磁盘 I/O
- 网络基础架构
CPU 性能分析
对于报告运行缓慢的每个节点,请检查 isi_hw_status 和 top 输出。
- 识别虚拟核心
从 isi_hw_status,计算虚拟核心数:
Virtual Cores = CPUs × Cores per CPU × 2 (if Hyperthreading is enabled)
示例:
PROC: Single-proc, Dual-HT-core → 1 × 2 × 2 = 4 virtual cores
- 检查负载平均值
从 top 输出,查看 1、3 和 5 分钟负载平均值:
load averages: 4.71, 3.48, 3.09
如果 负载平均值 超过 虚拟核心数,则 CPU 负载可能是导致 NDMP 性能问题的因素。建议减少活动进程的数量或将负载重新分发到使用不频繁的节点。
磁盘性能分析
步骤:
- 查看驱动器统计信息
对于报告运行缓慢的每个节点,请检查 isi statistics drive,然后检查 “队列 ”列。值:
- > 1.0 表示排队
- > 1.5 提示性能显著下降
示例:
Queued: 2.3 → High I/O wait on the spindle
- 检查存储利用率
确保磁盘利用率低于 90%。高利用率会加剧性能问题。
示例:
Used: 63.2% <-- Within acceptable range
- 建议
如果队列数量较多,请减少 I/O 负载、重新分发备份或扩展资源。
网络性能分析(仅限三向 NDMP)
步骤:
- 识别 NDMP 连接
在 netstat 输出,找到 NDMP CONTROL 连接(端口 10000)并标识相应的 DATA 连接(通常列在其上方)。
示例:
tcp4 0 384563 172.19.220.31.23261 172.19.200.22.55621 ESTABLISHED ← DATA tcp4 0 0 172.17.2.91.10000 172.19.200.22.55424 ESTABLISHED ← CONTROL
- 分析 Send-Q
高且稳定的 Send-Q(例如, 六位数 值)表示正在发送数据但未确认,这表明存在瓶颈。
- 检查备份服务器
在备份服务器上,检查 Recv-Q.较高的值意味着数据管理应用程序 (DMA) 不堪重负。
- 建议
如果数据管理应用程序 (DMA) 是瓶颈,建议联系 DMA 支持团队以获得进一步的帮助。
Affected Products
Isilon, PowerScale OneFSProducts
Isilon Backup AcceleratorArticle Properties
Article Number: 000187297
Article Type: How To
Last Modified: 20 Aug 2025
Version: 6
Find answers to your questions from other Dell users
Support Services
Check if your device is covered by Support Services.