PowerScale: NDMP Prestandafelsökning
Summary: När du undersöker prestandaproblem med NDMP (Network Data Management Protocol) på ett PowerScale-kluster finns det några viktiga områden att undersöka för möjliga orsaker.
Instructions
I den nyare versionen av OneFS 9.x.x har flera prestandaförbättringar gjorts för NDMP. Kontrollera klustrets version och installerade RUP:er för att säkerställa att de senaste förbättringarna tillämpas.
Utvärdering av NDMP-prestanda bör bedömas genom analys av tre viktiga systemresurser:
- Utnyttjandegrad för processor
- Disk-I/O
- Nätverksinfrastruktur
Analys av processorprestanda
För varje nod som rapporteras köras långsamt kontrollerar du isi_hw_status och top Utgångar.
- Identifiera virtuella kärnor
Från isi_hw_status, beräkna virtuella kärnor:
Virtual Cores = CPUs × Cores per CPU × 2 (if Hyperthreading is enabled)
Exempel:
PROC: Single-proc, Dual-HT-core → 1 × 2 × 2 = 4 virtual cores
- Kontrollera medelvärden för belastning
Från top Granska medelvärdena för 1, 3 och 5 minuters belastning:
load averages: 4.71, 3.48, 3.09
Om belastningsgenomsnittet överskrider antalet virtuella kärnor kan CPU-belastningen vara en bidragande faktor till NDMP-prestandaproblem. Rekommendationen är att minska antalet aktiva processer eller omfördela belastningen till noder som används mindre intensivt.
Analys av diskprestanda
Steg:
- Granska enhetsstatistik
För varje nod som rapporteras köras långsamt kontrollerar du isi statistics driveoch undersök kolumnen Kö . Ett värde:
- > 1.0 indikerar kö
- > 1.5 tyder på betydande prestandaförsämring
Queued: 2.3 → High I/O wait on the spindle
- Kontrollera lagringsanvändningen
Se till att diskanvändningen är under 90 %. Hög användning kan förvärra prestandaproblem.
Exempel:
Used: 63.2% <-- Within acceptable range
- Rekommendationer
Om köerna är höga kan du minska I/O-belastningen, omfördela säkerhetskopior eller skala resurser.
Analys av nätverksprestanda (endast trevägs NDMP)
Steg:
- Identifiera NDMP-anslutningar
I den netstat utgång, leta reda på NDMP CONTROL-anslutningen (port 10000) och identifiera motsvarande DATA-anslutning (vanligtvis listad ovanför den).
Exempel:
tcp4 0 384563 172.19.220.31.23261 172.19.200.22.55621 ESTABLISHED ← DATA tcp4 0 0 172.17.2.91.10000 172.19.200.22.55424 ESTABLISHED ← CONTROL
- Analysera Send-Q
En hög och stabil Send-Q (till exempel ett sexsiffrigt värde) indikerar att data skickas men inte bekräftas, vilket tyder på en flaskhals.
- Kontrollera säkerhetskopieringsservern
- Rekommendationer
Om datahanteringsprogrammet (DMA) är flaskhalsen rekommenderar vi att du kontaktar DMA-supportteamet för ytterligare hjälp.