PowerScale: Solución de problemas de rendimiento de NDMP
Summary: Cuando se investigan problemas de rendimiento del Network Data Management Protocol (NDMP) en un clúster de PowerScale, hay algunas áreas clave que se deben investigar para determinar las posibles causas. ...
Instructions
En la versión más reciente de OneFS 9.x.x, se realizaron varias mejoras de rendimiento en NDMP. Verifique la versión del clúster y las RUP instaladas para asegurarse de que se estén aplicando las mejoras más recientes.
La evaluación del rendimiento de NDMP debe evaluarse mediante el análisis de tres recursos clave del sistema:
- Utilización de CPU
- I/O de disco
- Infraestructura de red
Análisis de rendimiento de CPU
Para cada nodo que se informa que se ejecuta lentamente, compruebe el isi_hw_status y top Salidas.
- Identificar núcleos virtuales
En isi_hw_status, calcule los núcleos virtuales:
Virtual Cores = CPUs × Cores per CPU × 2 (if Hyperthreading is enabled)
Ejemplo:
PROC: Single-proc, Dual-HT-core → 1 × 2 × 2 = 4 virtual cores
- Comprobar promedios de carga
Del top Salida, revise los promedios de carga de 1, 3 y 5 minutos:
load averages: 4.71, 3.48, 3.09
Si el promedio de carga supera la cantidad de núcleos virtuales, la carga de CPU podría ser un factor que contribuye a los problemas de rendimiento de NDMP. La recomendación es reducir la cantidad de procesos activos o redistribuir la carga a los nodos menos utilizados.
Análisis de rendimiento de disco
Pasos:
- Revisar estadísticas de unidades
Para cada nodo que se informa que se ejecuta lentamente, compruebe el isi statistics drivey examine la columna Queue . Un valor:
- > 1.0 indica cola
- > 1.5 sugiere una degradación significativa del rendimiento
Queued: 2.3 → High I/O wait on the spindle
- Comprobar la utilización del almacenamiento
Asegúrese de que el uso del disco sea inferior al 90 %. Una utilización elevada puede agravar los problemas de rendimiento.
Ejemplo:
Used: 63.2% <-- Within acceptable range
- Recomendaciones
Si la cola es alta, reduzca la carga de I/O, redistribuya los respaldos o escale los recursos.
Análisis de rendimiento de red (solo NDMP de tres vías)
Pasos:
- Identificar conexiones NDMP
En netstat resultado, ubique la conexión NDMP CONTROL (puerto 10000) e identifique la conexión de DATOS correspondiente (normalmente enumerada arriba).
Ejemplo:
tcp4 0 384563 172.19.220.31.23261 172.19.200.22.55621 ESTABLISHED ← DATA tcp4 0 0 172.17.2.91.10000 172.19.200.22.55424 ESTABLISHED ← CONTROL
- Analizar Send-Q
Un Send-Q alto y estable (por ejemplo, un valor de seis dígitos) indica que los datos se envían pero no se confirman, lo que sugiere la existencia de un cuello de botella.
- Comprobar servidor de respaldo
- Recomendaciones
Si la aplicación de administración de datos (DMA) es el cuello de botella, se recomienda comunicarse con el equipo de soporte de DMA para obtener más ayuda.