PowerScale: Fejlfinding af NDMP-ydeevne
Summary: Når du undersøger problemer med NDMP-ydeevnen (Network Data Management Protocol) på en PowerScale-klynge, er der nogle vigtige områder, der skal undersøges for at finde mulige årsager.
Instructions
I den nyere version af OneFS 9.x.x blev der foretaget flere ydeevneforbedringer af NDMP. Kontroller klyngens version og installerede rup'er for at sikre, at de seneste forbedringer anvendes.
Evaluering af NDMP-ydeevne bør vurderes ved at analysere tre centrale systemressourcer:
- CPU-udnyttelse
- Disk I/O
- Netværksinfrastruktur
Analyse af CPU-ydeevne
For hver node, der rapporteres at køre langsomt, skal du kontrollere isi_hw_status og top Udgange.
- Identificer virtuelle kerner
Fra isi_hw_status, beregne virtuelle kerner:
Virtual Cores = CPUs × Cores per CPU × 2 (if Hyperthreading is enabled)
Eksempel:
PROC: Single-proc, Dual-HT-core → 1 × 2 × 2 = 4 virtual cores
- Kontrollér belastningsgennemsnit
Fra top output, gennemgå belastningsgennemsnittene på 1, 3 og 5 minutter:
load averages: 4.71, 3.48, 3.09
Hvis belastningsgennemsnittet overstiger antallet af virtuelle kerner, kan CPU-belastningen være en medvirkende faktor til problemer med NDMP-ydeevnen. Anbefalingen er at reducere antallet af aktive processer eller omfordele belastningen til mindre anvendte noder.
Analyse af diskydeevne
Trin:
- Gennemse drevstatistik
For hver node, der rapporteres at køre langsomt, skal du kontrollere isi statistics drive, og undersøge kolonnen Kø . A værdi:
- > 1.0 angiver kø
- > 1.5 tyder på betydelig forringelse af ydeevnen
Queued: 2.3 → High I/O wait on the spindle
- Kontrollér storageudnyttelse
Sørg for, at diskforbruget er under 90 %. Høj udnyttelse kan forværre problemer med ydeevnen.
Eksempel:
Used: 63.2% <-- Within acceptable range
- Anbefalinger
Hvis køen er høj, skal du reducere I/O-belastningen, omfordele sikkerhedskopier eller skalere ressourcerne.
Analyse af netværksydeevne (kun trevejs NDMP)
Trin:
- Identificer NDMP-forbindelser
I netstat output, find NDMP CONTROL-forbindelsen (port 10000), og identificer den tilsvarende DATA-forbindelse (typisk angivet over den).
Eksempel:
tcp4 0 384563 172.19.220.31.23261 172.19.200.22.55621 ESTABLISHED ← DATA tcp4 0 0 172.17.2.91.10000 172.19.200.22.55424 ESTABLISHED ← CONTROL
- Analysér Send-Q
En høj og stabil Send-Q (f.eks. en sekscifret værdi) angiver, at data sendes, men ikke anerkendes, hvilket tyder på en flaskehals.
- Kontroller sikkerhedskopieringsserveren
- Anbefalinger
Hvis datastyringsprogrammet (DMA) er flaskehalsen, anbefales det at kontakte DMA-supportteamet for yderligere hjælp.