Isilon OneFS : Comment effectuer une opération smartfail hors d’un pool de nœuds
Summary: Cet article explique comment effectuer correctement le processus smartfail d’un pool de nœuds qui n’est plus nécessaire dans un cluster.
Instructions
Voici les étapes à suivre pour effectuer correctement le smartfail d’un pool de nœuds qui n’est plus nécessaire dans le cluster.
- Déplacez la plupart des données à l’aide de règles de pool de fichiers
- À l’aide de la CLI ou de l’interface utilisateur Web, modifiez les règles de pool de fichiers afin de pointer les données du pool en cours de mise hors service vers un autre pool du cluster. Pour obtenir de l’aide sur la meilleure façon de le configurer, reportez-vous au Guide d’administration de votre version de OneFS.
Une fois que les règles de pool de fichiers ont été modifiées, lancez une tâche SmartPools afin d’appliquer les modifications apportées. Si les règles de pool de fichiers ont été configurées correctement, cela devrait déplacer la plupart des données.
Remarque : Il est normal qu’un espace soit encore utilisé sur le pool de nœuds (généralement moins de 5 %, mais cela peut être plus). C’est très bien et cela ne causera aucun problème.
- Assurez-vous que le débordement global est activé afin que le dernier bit de données sur les nœuds soit autorisé à être déplacé vers d’autres pools de nœuds.
CLI :# isi storagepool settings view
WebUI :
système de fichiers ->pools de stockage ->paramètres SmartPools
Si ce n’est pas le cas, assurez-vous qu’il l’est.
- Démarrez le processus SmartFail.
Exécutez une opération Smartfail sur un nœud à la fois à l’aide de la commande suivante :
OneFS 7.x# isi devices -a smartfail -d <node LNN>
OneFS 8.x# isi devices node smartfail --node-lnn=<node LNN>
Une fois le processus SmartFail terminé (tâche FlexProtect/Lin), passez au nœud suivant.
Exécutez une opération smartfail sur les failles un par un jusqu’à ce qu’il ne reste plus que deux nœuds.
Démarrez le processus SmartFail sur les deux nœuds ensemble pour un quorum de pool de nœuds d’au moins 51 % des appareils en ligne.
Le processus d’échec de lecture directe d’un seul nœud sur les 2 derniers rompt le quorum et il ne peut pas terminer le processus d’échec de lecture directe.
Le fait de placer les deux nœuds dans un état SmartFail permet de conserver le quorum, les données sont réparties sur les autres pools de nœuds.
Additional Information
Vérifiez toujours que la balise système réside également sur les pools de nœuds qui ne feront PAS l’objet d’une opération smartfail à partir du cluster.
Article de la base de connaissances pour Balise système : Impact de PowerScale 9.x sur les performances des clusters de nœuds mixtes avec nœuds d’archivage
Pour vérifier quels ID de pool ont la balise système, utilisez la commande ci-dessous :
sysctl efs.bam.disk_pool_db|grep -B2 -A10 system_group
Exemple de recherche de ligne pour pool_and_group_ids :
pool_and_group_ids={ 3, 4, 5 }
Utilisez la commande ci-dessous pour confirmer que les ID des pools de disques correspondent à la sortie ci-dessus :
isi storagepool health
Dans l’exemple de ligne, recherchez le numéro après le nom du pool de disques. L’exemple ci-dessous montre : 3 signification ID 3 :
s210_6.9tb_800gb- UM--- HDD +2d:1n 2:bay4,9,11,13,1 Nodes: Nodes:
ssd_32gb:3 8,23, 1:bay4,9,1 Drives: Drives:
3,18,23