PowerScale. Поиск и устранение проблем производительности NDMP
Summary: При исследовании проблем производительности протокола управления сетевыми данными (NDMP) в кластере PowerScale необходимо изучить несколько ключевых областей для выявления возможных причин. ...
Instructions
В более новой версии OneFS 9.x.x в NDMP было внесено несколько улучшений производительности. Проверьте версию кластера и установленные накопительные записи, чтобы убедиться, что применяются последние улучшения.
Для оценки производительности NDMP следует проанализировать три ключевых системных ресурса:
- Использование ЦП
- Операции ввода-вывода диска
- Сетевая инфраструктура
Анализ производительности ЦП
Для каждого узла, который, как сообщается, работает медленно, проверьте isi_hw_status и top Выходы.
- Идентификация виртуальных ядер
В isi_hw_status, вычисляем виртуальные ядра:
Virtual Cores = CPUs × Cores per CPU × 2 (if Hyperthreading is enabled)
Пример.
PROC: Single-proc, Dual-HT-core → 1 × 2 × 2 = 4 virtual cores
- Проверка средних значений нагрузки
Из top Просмотрите средние значения нагрузки за 1, 3 и 5 минут:
load averages: 4.71, 3.48, 3.09
Если средняя нагрузка превышает количество виртуальных ядер, нагрузка на ЦП может быть фактором, вызывающим проблемы с производительностью NDMP. Рекомендуется уменьшить количество активных процессов или перераспределить нагрузку на менее интенсивно используемые узлы.
Анализ производительности диска
Действия
- Просмотр статистики дисков
Для каждого узла, который, как сообщается, работает медленно, проверьте isi statistics driveи изучите столбец Queue . Значение:
- > 1.0 обозначает организацию очереди
- > 1,5 указывает на значительное снижение производительности
Queued: 2.3 → High I/O wait on the spindle
- Проверка использования ресурсов хранилища
Убедитесь, что использование диска не превышает 90%. Высокая загрузка может усугубить проблемы с производительностью.
Пример.
Used: 63.2% <-- Within acceptable range
- Рекомендации
При высоком количестве очередей уменьшите нагрузку ввода-вывода, перераспределите резервные копии или масштабируйте ресурсы.
Анализ производительности сети (только трехсторонний NDMP)
Действия
- Идентификация соединений NDMP
В netstat найдите соединение NDMP CONTROL (порт 10000) и определите соответствующее соединение DATA (обычно указанное над ним).
Пример.
tcp4 0 384563 172.19.220.31.23261 172.19.200.22.55621 ESTABLISHED ← DATA tcp4 0 0 172.17.2.91.10000 172.19.200.22.55424 ESTABLISHED ← CONTROL
- Анализировать Send-Q
Высокое и стабильное значение Send-Q (например, шестизначное значение) указывает на то, что данные отправляются, но не подтверждаются, что указывает на узкое место.
- Проверить сервер резервного копирования
- Рекомендации
Если узким местом является приложение для управления данными (DMA), рекомендуется обратиться за помощью в службу поддержки DMA.