PowerScale : Utilisation d’AutoBalanceLin pour déplacer rapidement les données d’un pool de nœuds plein

Résumé: Cet article explique comment utiliser la tâche AutoBalanceLin pour libérer rapidement de l’espace si un pool à nœud unique est saturé ou presque à 100 % de sa capacité. Cette procédure ne doit être utilisée que si toutes les autres méthodes de libération d’espace disque sur un pool de nœuds ont été utilisées. ...

Cet article concerne Cet article ne concerne pas Cet article n’est associé à aucun produit spécifique. Toutes les versions du produit ne sont pas identifiées dans cet article.

Instructions

Remarque : La procédure suivante nécessite la suppression des règles de pool de fichiers existantes et l’agrégation par bandes des données sur tous les nœuds, quel que soit le workflow auquel les données appartiennent. Sans les règles de pool de fichiers, aucune gestion des données n’a lieu entre les pools ou les niveaux. Assurez-vous de bien comprendre l’impact de cette procédure, car elle peut entraîner une dégradation des performances. N’effectuez cette opération qu’en dernier recours, une fois que toutes les autres options de résolution des problèmes de capacité ont été essayées.

Il est largement admis que AutoBalance et AutoBalanceLin Équilibrez uniquement les données au sein des pools de nœuds et non entre les pools de nœuds. De plus, on pense que seuls les smartpools/smartpoolstree Peut déplacer des données entre deux pools de nœuds.

Les tests sur OneFS 8.0 et les versions ultérieures prouvent que ce n’est pas tout à fait vrai. Si le cluster n’a que la règle de pools de fichiers par défaut anywhere:anywhere, AutoBalanceLin et AutoBalance Déplace les données sur plusieurs pools de nœuds.

Cela ne doit être utilisé qu’à titre de solution de contournement d’urgence pour les clusters qui disposent d’un pool de nœuds plein. Ce processus déplace rapidement les données hors du pool de nœuds plein.

Question: Quand voudrait-on utiliser la procédure suivante ?
Réponse: Cette procédure est utilisée lorsque les conditions suivantes sont réunies :
  • Le cluster contient plusieurs pools de nœuds, et un ou plusieurs pools de nœuds sont pleins à 100 %.
  • Il est nécessaire de libérer immédiatement de l’espace disque sur un pool de nœuds plein.
  • L’organisation exacte des données n’est pas une préoccupation immédiate.


Étapes :

  1. Prenez note de toutes les règles de pools de fichiers existantes, puis supprimez-les, à l’exception de la règle par défaut 'any:any' règles de pool de fichiers configurées sur le cluster.

Avant de passer à cette étape :

  • Enregistrez la configuration actuelle de la règle de pool de fichiers avant de supprimer les règles. Si le temps le permet, il est recommandé de procéder à une collecte complète des logs.
  • Par défaut, les clusters Isilon sont configurés avec la règle de pool de fichiers par défaut définie pour l’écriture des données 'anywhere:anywhere'. Vérifiez que la règle de pool de fichiers par défaut est rétablie sur ces paramètres par défaut avant de continuer.
Exemple : Règle de pools de fichiers par défaut. Notez que les cibles de stockage sont définies sur 'anywhere'.
# isi filepool default-policy view
          Set Requested Protection: default
               Data Access Pattern: concurrency
                  Enable Coalescer: Yes
                    Enable Packing: No
               Data Storage Target: anywhere
                 Data SSD Strategy: metadata
           Snapshot Storage Target: anywhere
             Snapshot SSD Strategy: metadata
                        Cloud Pool: -
         Cloud Compression Enabled: -
          Cloud Encryption Enabled: -
              Cloud Data Retention: -
Cloud Incremental Backup Retention: -
       Cloud Full Backup Retention: -
               Cloud Accessibility: -
                  Cloud Read Ahead: -
            Cloud Cache Expiration: -
         Cloud Writeback Frequency: -
      Cloud Archive Snapshot Files: -
                                ID: -
  1. Exécutez un SmartPools Tâche pour appliquer de nouveaux marquages de répertoire :
# isi job start smartpools -p 1 --policy medium
 
Remarque : Attendez-vous à ce que le Smartpools tâche à terminer plus rapidement que d’habitude avec seulement le anywhere:anywhere Une règle de pools de fichiers par défaut est en place.
 
Remarque : En raison d’une nouvelle conception dans les versions ultérieures de OneFS, l’erreur suivante peut se produire lorsque vous tentez d’exécuter la commande SmartPools Tâche due à un pool de nœuds trop saturé :
# isi job jobs start SmartPools

Job operation failed: Job 'SmartPools' cannot start because the cluster's free disk space percentage is below 2 (isi_gconfig -t job-config core.free_blocks_pct_threshold_lo threshold) and this job does not free disk space. Free up some space (e.g. run TreeDelete, SnapshotDelete) then try again.: No space left on device

Si vous NE VOYEZ PAS le message d’erreur ci-dessus, passez à l’étape 3 ci-dessous.

Si ce message d’erreur s’affiche , passez à l’étape 2a ci-dessous.

  1. Vérifiez à nouveau s’il existe des données que vous pouvez supprimer pour libérer de l’espace sur le pool de nœuds plein. Cela inclut la recherche de snapshots volumineux, ainsi que la recherche de fichiers système ou d’audit volumineux avec les commandes suivantes :
Isilon-28# du -sh /ifs/.ifsvar/audit/logs
 
Islon-28# du -sh /ifs/.ifsvar

Si vous pouvez supprimer suffisamment de données, essayez d’exécuter la commande SmartPools travail à nouveau.

S’il n’y a absolument aucune donnée pouvant être supprimée, l’étape d’atténuation recommandée serait la suivante :

  1. Modifiez la règle de pool de fichiers par défaut, ci-dessus, pour écrire dans le pool de nœuds le moins plein. 
  2. Identifiez un chemin d’accès des données sur le pool de nœuds complet qui inclut la plupart des données.
  3. Dans une session d’écran, exécutez :   
# isi filepool apply -r <data path>   to manually move data under a certain path

i.e.

# isi filepool apply -r /ifs/data/win_data/test_data

verify the job is running:

# ps auwx | grep apply
root   45237   98.1  0.0 102268  61176  0  R+   13:34          0:35.04 /usr/libexec/isilon/isi /usr/bin/isi filepool apply -r /ifs/
  1. Surveillez la capacité. Une fois que le pool de nœuds saturé est inférieur à 96 %, recommencez avec l’étape 2 ci-dessus.
  1. Exécutez une AutoBalanceLin pendant quelques heures, et surveiller l’espace. (Contrairement à AutoBalance, qui effectue un parcours complet dans l’arborescence avant de déplacer des données, AutoBalanceLin répartit les données immédiatement)
# isi job start autobalancelin -p 1 --policy medium

Observez presque immédiatement que les données se déplacent entre les pools de nœuds et que le pool de nœuds complet doit se libérer dans l’espace disque.
 
Remarque : Pour cette étape, AutoBalanceLin n’a pas besoin de s’exécuter jusqu’à la fin. Surveillez les paramètres AutoBalanceLin jusqu’à ce que l’objectif de nettoyage de l’ensemble du pool de nœuds soit atteint, puis annulez la tâche. Par exemple, vous pouvez annuler la tâche une fois que le pool de nœuds saturé atteint 85 % de sa capacité.
 
Remarque : Surveillez l’utilisation du cluster et vérifiez que d’autres tâches sont annulées ou interrompues si l’espace est affecté.

Continuez à surveiller l’espace toutes les heures environ jusqu’à ce que l’espace soit à un niveau suffisant à l’aide de la commande suivante :
# isi stat -p -v
 
Remarque : Encore une fois, il n’est pas conseillé de laisser AutoBalanceLin Exécutez jusqu’à la fin. À un certain stade, la tâche peut déplacer les données dans une nouvelle direction et commencer à produire des résultats indésirables. Par exemple, elle inverse le déplacement des données, ce qui peut conduire à ce que l’autre pool de nœuds approche de sa pleine capacité lorsque le pool précédent se vide. Exécuter uniquement AutobalanceLIN Pendant quelques heures, ou jusqu’à ce que l’espace soit nettoyé, puis annulez une fois l’objectif atteint.

Une fois que le cluster a atteint un dégagement d’espace sur le pool de nœuds plein, annulez la AutoBalanceLin Travail:
# isi job cancel autobalancelin
 
Remarque : pour des résultats optimaux, les niveaux de protection entre les pools de nœuds doivent être de valeur égale. 

Informations supplémentaires

Résultats des tests en laboratoire :

Deux pools de nœuds, niveaux
de protection égaux C’est avant :

Node Pool Name: x410_archive          Protection:        +2d:1n
Pool Storage:     HDD                 SSD Storage
Size:             85.2T (94.6T Raw)   2.2T (2.2T Raw)
VHS Size:         9.4T
Used:             29.9T (35%)         35.2G (2%)
Avail:            55.3T (65%)         2.1T (98%)

                           Throughput (bps)  HDD Storage      SSD Storage
Name               Health|  In   Out  Total| Used / Size     |Used / Size
-------------------+-----+-----+-----+-----+-----------------+-----------------
  5|10.5.80.190    | OK  |881.6|    0|881.6|10.0T/31.5T( 32%)|11.7G/ 738G(  2%)
  6|10.5.80.191    |-A-- |    0|    0|    0|10.0T/31.5T( 32%)|11.7G/ 738G(  2%)
  7|10.5.80.192    | OK  |    0|    0|    0|10.0T/31.5T( 32%)|11.7G/ 738G(  2%)
-------------------+-----+-----+-----+-----+-----------------+-----------------
x410_archive       |  OK |110.2|    0|110.2|29.9T/85.2T( 35%)|35.2G/ 2.2T(  2%)

Node Pool Name: x410_35tb_800gb-ssd_64gbProtection:        +2d:1n
Pool Storage:     HDD                 SSD Storage
Size:             112.8T (125.3T Raw) 2.9T (2.9T Raw)
VHS Size:         12.5T
Used:             5.6T (5%)           7.9G (< 1%)
Avail:            107.2T (95%)        2.9T (> 99%)

                           Throughput (bps)  HDD Storage      SSD Storage
Name               Health|  In   Out  Total| Used / Size     |Used / Size
-------------------+-----+-----+-----+-----+-----------------+-----------------
  1|10.5.80.186    | OK  | 2.9M|82.8M|85.6M| 1.4T/31.5T(  4%)| 2.0G/ 738G(< 1%)
  2|10.5.80.187    |-A-- | 104k|38.8k| 143k| 1.4T/30.6T(  5%)| 1.9G/ 738G(< 1%)
  3|10.5.80.188    | OK  |881.6|    0|881.6| 1.4T/31.5T(  4%)| 2.0G/ 738G(< 1%)
  4|10.5.80.189    | OK  |    0|25.8k|25.8k| 1.4T/31.5T(  4%)| 2.0G/ 738G(< 1%)
-------------------+-----+-----+-----+-----+-----------------+-----------------
x410_35tb_800gb-ssd|-M---| 371k|10.4M|10.7M| 5.6T/112.8T(  5%)| 7.9G/ 2.9T(< 1%)
  _64gb            |     |     |     |     |                 |




X410-2# date
Thu Jun 14 16:53:29 CDT 2018


one filepool policy set to default any:any


X410-2# isi job start autobalancelin -p 1 --policy medium
Started job [7159]


in as little as 30 minutes you will see data shift between the two pools, i.e. our first node pool, below, dropped from 32% full to 29%


X410-2# date
Thu Jun 14 17:24:20 CDT 2018



Node Pool Name: x410_archive          Protection:        +2d:1n
Pool Storage:     HDD                 SSD Storage
Size:             85.2T (94.6T Raw)   2.2T (2.2T Raw)
VHS Size:         9.4T
Used:             27.7T (33%)         34.3G (2%)
Avail:            57.5T (67%)         2.1T (98%)

                           Throughput (bps)  HDD Storage      SSD Storage
Name               Health|  In   Out  Total| Used / Size     |Used / Size
-------------------+-----+-----+-----+-----+-----------------+-----------------
  5|10.5.80.190    | OK  | 1.1k|25.8k|26.9k| 9.2T/31.5T( 29%)|11.4G/ 738G(  2%)
  6|10.5.80.191    |-A-- | 1.1k| 1.2M| 1.2M| 9.2T/31.5T( 29%)|11.4G/ 738G(  2%)
  7|10.5.80.192    | OK  |28.6k| 5.2k|33.7k| 9.2T/31.5T( 29%)|11.4G/ 738G(  2%)
-------------------+-----+-----+-----+-----+-----------------+-----------------
x410_archive       |  OK | 3.8k| 152k| 156k|27.7T/85.2T( 33%)|34.3G/ 2.2T(  2%)

Node Pool Name: x410_35tb_800gb-ssd_64gbProtection:        +2d:1n
Pool Storage:     HDD                 SSD Storage
Size:             112.8T (125.3T Raw) 2.9T (2.9T Raw)
VHS Size:         12.5T
Used:             7.6T (7%)           8.8G (< 1%)
Avail:            105.2T (93%)        2.9T (> 99%)

                           Throughput (bps)  HDD Storage      SSD Storage
Name               Health|  In   Out  Total| Used / Size     |Used / Size
-------------------+-----+-----+-----+-----+-----------------+-----------------
  1|10.5.80.186    | OK  |37.9k| 279k| 316k| 1.9T/31.5T(  6%)| 2.2G/ 738G(< 1%)
  2|10.5.80.187    |-A-- | 1.4M|34.8M|36.2M| 1.9T/30.6T(  6%)| 2.2G/ 738G(< 1%)
  3|10.5.80.188    | OK  | 130k|30.9k| 161k| 1.9T/31.5T(  6%)| 2.2G/ 738G(< 1%)
  4|10.5.80.189    | OK  |    0|    0|    0| 1.9T/31.5T(  6%)| 2.2G/ 738G(< 1%)
-------------------+-----+-----+-----+-----+-----------------+-----------------
x410_35tb_800gb-ssd|-M---| 198k| 4.4M| 4.6M| 7.6T/112.8T(  7%)| 8.8G/ 2.9T(< 1%)
  _64gb            |     |     |     |     |                 |

Continuez à surveiller toutes les heures environ jusqu’à ce que l’espace disque soit à un niveau suffisant.

 
Remarque : Ne laissez pas AutoBalanceLin Exécutez jusqu’à la fin. La tâche déplace les données dans la direction opposée, ce qui peut commencer à produire des résultats indésirables. L’espace disque consommé peut s’inverser, ce qui peut conduire à nouveau à un pool de nœuds presque plein. N’exécutez la tâche que pendant quelques heures.

Point d’une heure :
X410-2# date
Thu Jun 14 17:54:30 CDT 2018



Node Pool Name: x410_archive          Protection:        +2d:1n
Pool Storage:     HDD                 SSD Storage
Size:             85.2T (94.6T Raw)   2.2T (2.2T Raw)
VHS Size:         9.4T
Used:             25.2T (30%)         33.9G (2%)
Avail:            60.0T (70%)         2.1T (98%)

                           Throughput (bps)  HDD Storage      SSD Storage
Name               Health|  In   Out  Total| Used / Size     |Used / Size
-------------------+-----+-----+-----+-----+-----------------+-----------------
  5|10.5.80.190    | OK  |881.6|20.6k|21.5k| 8.4T/31.5T( 27%)|11.3G/ 738G(  2%)
  6|10.5.80.191    |-A-- |    0|    0|    0| 8.4T/31.5T( 27%)|11.3G/ 738G(  2%)
  7|10.5.80.192    | OK  | 2.2k| 216k| 218k| 8.4T/31.5T( 27%)|11.3G/ 738G(  2%)
-------------------+-----+-----+-----+-----+-----------------+-----------------
x410_archive       |  OK |385.7|29.5k|29.9k|25.2T/85.2T( 30%)|33.9G/ 2.2T(  2%)


X410-2# date
Thu Jun 14 18:54:43 CDT 2018




Node Pool Name: x410_archive          Protection:        +2d:1n
Pool Storage:     HDD                 SSD Storage
Size:             85.2T (94.6T Raw)   2.2T (2.2T Raw)
VHS Size:         9.4T
Used:             21.6T (25%)         26.8G (1%)
Avail:            63.6T (75%)         2.1T (99%)

                           Throughput (bps)  HDD Storage      SSD Storage
Name               Health|  In   Out  Total| Used / Size     |Used / Size
-------------------+-----+-----+-----+-----+-----------------+-----------------
  5|10.5.80.190    | OK  |22.9k| 1.4M| 1.5M| 7.2T/31.5T( 23%)| 8.9G/ 738G(  1%)
  6|10.5.80.191    |-A-- |881.6| 231k| 232k| 7.2T/31.5T( 23%)| 8.9G/ 738G(  1%)
  7|10.5.80.192    | OK  |    0|    0|    0| 7.2T/31.5T( 23%)| 8.9G/ 738G(  1%)
-------------------+-----+-----+-----+-----+-----------------+-----------------
x410_archive       |  OK | 3.0k| 210k| 213k|21.6T/85.2T( 25%)|26.8G/ 2.2T(  1%)


L’espace est suffisamment nettoyé. La commande AutoBalanceLIn La tâche peut être annulée, car les résultats souhaités ont été atteints.

Produits concernés

Isilon X400
Propriétés de l’article
Numéro d’article: 000009283
Type d’article: How To
Dernière modification: 23 juin 2026
Version:  9
Trouvez des réponses à vos questions auprès d’autres utilisateurs Dell
Services de support
Vérifiez si votre appareil est couvert par les services de support.