PowerScale : SmartFail peut ne pas se terminer si le nœud homologue dispose d’une partition var complète
Summary: Dans un cluster, les nœuds sont configurés en tant qu’homologues, ce qui signifie qu’ils travaillent ensemble pour partager des ressources et gérer les données. Si smartfail entraîne l’échec des nœuds, un /var complet sur un nœud peut bloquer la tâche FlexProtect et empêcher l’exécution de smartfail sur un autre nœud. ...
Symptoms
Lorsqu’un nœud fait l’objet d’une opération smartfail et que son nœud homologue dispose d’une /var , la tâche FlexProtect peut sembler ne faire que peu ou pas de progrès. La tâche peut sembler bloquée dans la phase 6, suppression du périphérique.
Par exemple, si le nœud 3 fait l’objet d’une opération smartfail et que le nœud 4 a une /var , la tâche FlexProtect peut ne pas se terminer, car les nœuds 3 et 4 sont des nœuds homologues.
Cause
Un système complet /var La partition peut empêcher les services et activités normaux du cluster de fonctionner correctement.
Dans cet exemple, l’attribut /var La partition est à 109 % de sa capacité.
Filesystem 512-blocks Used Avail Capacity iused ifree %iused Mounted on
/dev/mirror/root1 4045904 2275960 1446272 61% 42702 252720 14% /
devfs 2 2 0 100% 0 0 100% /dev
/dev/mirror/var1 4062544 4061056 -323512 109% 1971 260171 1% /var
/dev/mirror/var-crash 6087472 244896 5355584 4% 32 406174 0% /var/crash
/dev/mirror/keystore 126544 56 116368 0% 3 8187 0% /keystore
/dev/md0 122332 4572 107976 4% 238 16400 1% /tmp/ufp
/dev/md1.uzip 857646 799866 -10830 101% 2652 418 86% /base
/dev/md2 7132 2196 4368 33% 543 735 42% /tmp/ipmi
/dev/md3 122332 16 112532 0% 4 16634 0% /hwmon
OneFS 3019651793280 1465967775616 1455912400544 50% 93263665626 109978539654 46% /ifsResolution
Nettoyez le /var Partition sur le nœud homologue à l’aide des différentes méthodes détaillées dans les articles ci-dessous :
- Isilon : Notification d’événements : La capacité de la partition var est presque arrivée à saturation, ID d’événement : 100010001
- Isilon La partition /var/crash d'un nœud du cluster a atteint 90 % de sa capacité - ID d'événement : 100010002
- OneFS : Notification d’événements : Le nœud a atteint 95 % ou plus de sa capacité utilisée sur le système de fichiers racine (pour consulter cet article, vous devez vous connecter en tant qu’utilisateur enregistré au support Dell).