PowerScale: Smartfail wird möglicherweise nicht abgeschlossen, wenn der Peer-Node über eine vollständige var-Partition verfügt
Summary: In einem Cluster werden Nodes als Peers konfiguriert, was bedeutet, dass sie zusammenarbeiten, um Ressourcen gemeinsam zu nutzen und Daten zu verwalten. Wenn bei SmartFail Nodes ausfallen, kann ein vollständiger /var auf einem Node den FlexProtect-Job blockieren und den SmartFail eines anderen Nodes verhindern. ...
Symptoms
Wenn für einen Node ein Smartfail-Vorgang durchgeführt wird und sein Peer-Node über eine vollständige /var -Partition kann es vorkommen, dass der FlexProtect-Job wenig bis gar keine Fortschritte macht. Der Job scheint in Phase 6, dem Entfernen des Geräts, hängen zu bleiben.
Beispiel: Wenn für Node 3 ein Smartfail-Vorgang durchgeführt wird und für Node 4 eine vollständige /var -Partition kann der FlexProtect-Job möglicherweise nicht abgeschlossen werden, da die Nodes 3 und 4 Peer-Nodes sind.
Cause
Eine vollständige /var Partition kann dazu führen, dass normale Clusterdienste und -aktivitäten nicht ordnungsgemäß funktionieren.
In diesem Beispiel ist die /var Die Partition hat eine Kapazität von 109 %.
Filesystem 512-blocks Used Avail Capacity iused ifree %iused Mounted on
/dev/mirror/root1 4045904 2275960 1446272 61% 42702 252720 14% /
devfs 2 2 0 100% 0 0 100% /dev
/dev/mirror/var1 4062544 4061056 -323512 109% 1971 260171 1% /var
/dev/mirror/var-crash 6087472 244896 5355584 4% 32 406174 0% /var/crash
/dev/mirror/keystore 126544 56 116368 0% 3 8187 0% /keystore
/dev/md0 122332 4572 107976 4% 238 16400 1% /tmp/ufp
/dev/md1.uzip 857646 799866 -10830 101% 2652 418 86% /base
/dev/md2 7132 2196 4368 33% 543 735 42% /tmp/ipmi
/dev/md3 122332 16 112532 0% 4 16634 0% /hwmon
OneFS 3019651793280 1465967775616 1455912400544 50% 93263665626 109978539654 46% /ifsResolution
Bereinigen Sie die /var Partitionierung auf dem Peer-Node mithilfe der verschiedenen Methoden, die in den folgenden Artikeln beschrieben sind:
- Isilon: Ereignisbenachrichtigung: Die var-Partition hat fast ihre Kapazität erreicht, Ereignis-ID: 100010001
- Isilon Die /var/crash-Partition eines Node im Cluster hat eine Kapazität von 90 % erreicht – Ereignis-ID: 100010002
- OneFS: Ereignisbenachrichtigung: Der Node hat mindestens 95 % der genutzten Kapazität auf dem Stammdateisystem erreicht (Anmeldung als registrierter Dell Support-Nutzer ist erforderlich, um diesen Artikel anzuzeigen.)