PowerScale:NDMP 性能故障处理

摘要: 在调查 PowerScale 群集上的 Network Data Management Protocol (NDMP) 性能问题时,需要在一些关键方面进行调查以了解可能的原因。

本文适用于 本文不适用于 本文并非针对某种特定的产品。 本文并非包含所有产品版本。

说明

在较新版本的 OneFS 9.x.x 中,对 NDMP 进行了多项性能增强。验证群集的版本和已安装的 RUP,以确保应用最新的改进。

应通过分析三个关键系统资源来评估 NDMP 性能:

  • CPU 利用率
  • 磁盘 I/O
  • 网络基础架构

CPU 性能分析

对于报告运行缓慢的每个节点,请检查 isi_hw_statustop 输出。

  1. 识别虚拟核心

从 isi_hw_status,计算虚拟核心数:

Virtual Cores = CPUs × Cores per CPU × 2 (if Hyperthreading is enabled)

示例:

PROC: Single-proc, Dual-HT-core → 1 × 2 × 2 = 4 virtual cores
  1. 检查负载平均值

top 输出,查看 1、3 和 5 分钟负载平均值:

load averages: 4.71, 3.48, 3.09

如果 负载平均值 超过 虚拟核心数,则 CPU 负载可能是导致 NDMP 性能问题的因素。建议减少活动进程的数量或将负载重新分发到使用不频繁的节点。

磁盘性能分析

步骤:

  1. 查看驱动器统计信息

对于报告运行缓慢的每个节点,请检查 isi statistics drive,然后检查 “队列 ”列。值:

  • > 1.0 表示排队
  • > 1.5 提示性能显著下降
示例:
Queued: 2.3 → High I/O wait on the spindle
  1. 检查存储利用率

确保磁盘利用率低于 90%。高利用率会加剧性能问题。

示例:

Used: 63.2%  <-- Within acceptable range
  1. 建议

如果队列数量较多,请减少 I/O 负载、重新分发备份或扩展资源。

网络性能分析(仅限三向 NDMP)

步骤:

  1. 识别 NDMP 连接

在 netstat 输出,找到 NDMP CONTROL 连接(端口 10000)并标识相应的 DATA 连接(通常列在其上方)。

示例:

tcp4  0  384563 172.19.220.31.23261  172.19.200.22.55621  ESTABLISHED  ← DATA
tcp4  0       0 172.17.2.91.10000    172.19.200.22.55424  ESTABLISHED  ← CONTROL
  1. 分析 Send-Q

高且稳定的 Send-Q(例如, 六位数 值)表示正在发送数据但未确认,这表明存在瓶颈。

  1. 检查备份服务器
在备份服务器上,检查 Recv-Q.较高的值意味着数据管理应用程序 (DMA) 不堪重负。
  1. 建议

如果数据管理应用程序 (DMA) 是瓶颈,建议联系 DMA 支持团队以获得进一步的帮助。 

受影响的产品

Isilon, PowerScale OneFS

产品

Isilon Backup Accelerator
文章属性
文章编号: 000187297
文章类型: How To
上次修改时间: 20 8月 2025
版本:  6
从其他戴尔用户那里查找问题的答案
支持服务
检查您的设备是否在支持服务涵盖的范围内。