PowerScale: NDMP-Performance-Troubleshooting
Summary: Bei der Untersuchung von NDMP-Leistungsproblemen (Network Data Management Protocol) auf einem PowerScale-Cluster gibt es einige wichtige Bereiche, in denen Sie nach möglichen Ursachen suchen müssen. ...
Instructions
In der neueren Version von OneFS 9.x.x wurden mehrere Leistungsverbesserungen an NDMP vorgenommen. Überprüfen Sie die Version des Clusters und installierte RUPs, um sicherzustellen, dass die neuesten Verbesserungen angewendet werden.
Die Bewertung der NDMP-Performance sollte durch die Analyse von 3 wichtigen Systemressourcen erfolgen:
- CPU-Auslastung
- Festplatten-E/A
- Netzwerkinfrastruktur
CPU-Leistungsanalyse
Überprüfen Sie für jeden Node, von dem berichtet wird, dass er langsam ausgeführt wird, die isi_hw_status und top Ausgaben.
- Virtuelle Cores identifizieren
von isi_hw_status, berechnen Sie die virtuellen Kerne:
Virtual Cores = CPUs × Cores per CPU × 2 (if Hyperthreading is enabled)
Beispiel:
PROC: Single-proc, Dual-HT-core → 1 × 2 × 2 = 4 virtual cores
- Durchschnittliche Auslastung prüfen
Vom top Überprüfen Sie die 1-, 3- und 5-Minuten-Auslastungsdurchschnitte:
load averages: 4.71, 3.48, 3.09
Wenn die durchschnittliche Last die Anzahl der virtuellen Cores übersteigt, kann die CPU-Last ein Faktor sein, der zu NDMP-Performanceproblemen beiträgt. Es wird empfohlen, die Anzahl der aktiven Prozesse zu reduzieren oder die Last auf weniger stark ausgelastete Nodes umzuverteilen.
Analyse der Festplattenleistung
Schritte:
- Laufwerksstatistiken überprüfen
Überprüfen Sie für jeden Node, von dem berichtet wird, dass er langsam ausgeführt wird, die isi statistics drive, und überprüfen Sie die Spalte Warteschlange . Ein Wert:
- > 1.0 weist auf Warteschlange hin
- > 1.5 deutet auf eine erhebliche Leistungsverschlechterung hin
Queued: 2.3 → High I/O wait on the spindle
- Prüfen der Speicherauslastung
Stellen Sie sicher, dass die Festplattenauslastung unter 90 % liegt. Eine hohe Auslastung kann Performanceprobleme verschlimmern.
Beispiel:
Used: 63.2% <-- Within acceptable range
- Empfehlungen
Wenn die Warteschlangen hoch sind, reduzieren Sie die I/O-Last, verteilen Sie Backups neu oder skalieren Sie Ressourcen.
Netzwerkperformanceanalyse (nur Drei-Wege-NDMP)
Schritte:
- Identifizieren von NDMP-Verbindungen
Im netstat die NDMP CONTROL-Verbindung (Port 10000) ausfindig machen und die entsprechende DATA-Verbindung identifizieren (in der Regel darüber aufgeführt).
Beispiel:
tcp4 0 384563 172.19.220.31.23261 172.19.200.22.55621 ESTABLISHED ← DATA tcp4 0 0 172.17.2.91.10000 172.19.200.22.55424 ESTABLISHED ← CONTROL
- Analysieren von Send-Q
Ein hoher und stabiler Send-Q-Wert (z. B. ein sechsstelliger Wert) zeigt an, dass Daten gesendet, aber nicht bestätigt werden, was auf einen Engpass hindeutet.
- Backupserver prüfen
- Empfehlungen
Wenn die Datenmanagementanwendung (DMA) der Engpass ist, wird empfohlen, das DMA-Supportteam für weitere Unterstützung einzubeziehen.