PowerScale : Isilon : Utilisation élevée du processeur par isi_cpool_d à cause des opérations CloudPools
Yhteenveto: Le processus isi_cpool_d peut entraîner une utilisation élevée du processeur sur un cluster PowerScale Isilon.
Oireet
isi_cpool_d processus montre une utilisation élevée et continue du processeur sur le cluster.
Isilon-1# top -n 10 PID USERNAME THR PRI NICE SIZE RES STATE C TIME WCPU COMMAND 87857 root 124 20 0 595M 173M nanslp 13 1722.5 857.62% isi_cpool_d 3455 root 29 98 r150 397M 86M sigwai 10 4216.2 62.55% nfs 3313 root 40 98 r150 1018M 683M sigwai 14 7402.9 47.71% lwio 94259 root 13 52 0 566M 491M usem 18 374.1H 32.57% isi_celog_monitor 18378 root 5 20 0 102M 53M uwait 3 49:57 24.56% isi_job_d 34552 root 1 52 0 37M 15M adv 22 112.6H 20.51% isi_migr_sched 3144 root 13 20 0 52M 13M select 8 2009.5 15.33% isi_audit_d 98432 root 1 52 0 105M 66M kqread 26 417:47 14.55% isi_celog_analysis 3213 root 26 52 0 96M 28M uwait 10 1109.2 12.50% isi_avscan_d 51167 root 5 20 0 93M 42M uwait 21 74:37 10.40% isi_job_d ... ..
Plusieurs tâches CloudPools peuvent être en cours d’exécution sur le cluster, mais même lorsque toutes les tâches sont suspendues, l’utilisation de la isi_cpool_d reste élevée.
Isilon-1# isi cloud jobs list ID Description Effective State Type --------------------------------------------------------------------------------------- 1 Write updated data to the cloud paused cache-writeback 2 Expire CloudPools cache paused cache-invalidation 4 Clean up unreferenced data in the cloud paused cloud-garbage-collection 5 Write updated snapshot data to the cloud paused snapshot-writeback 6 Update SmartLink file formats paused smartlink-upgrade 7 Add data to CloudPools cache paused cache-pre-populate 959 paused archive 960 paused archive 961 paused archive 962 paused archive 964 paused archive 965 paused archive 966 paused archive 967 paused archive 968 paused archive ---------------------------------------------------------------------------------------
Isilon-1# top -n 5 PID USERNAME THR PRI NICE SIZE RES STATE C TIME WCPU COMMAND 87857 root 124 20 0 588M 180M nanslp 4 1723.5 805.81% isi_cpool_d 3455 root 28 98 r150 397M 87M sigwai 10 4216.3 69.34% nfs 18378 root 6 20 0 122M 72M uwait 9 53:18 68.36% isi_job_d 3313 root 49 98 r150 1019M 684M sigwai 14 7403.0 66.16% lwio 51167 root 6 20 0 94M 42M uwait 26 76:02 22.36% isi_job_d ...
Syy
Certaines opérations, telles que l’écriture différée du cache et l’invalidation du cache, se produisent en arrière-plan et ne sont pas directement corrélées à une tâche CloudPools en cours. La suspension des tâches CloudPools n’empêche pas l’exécution de ces opérations. Ces threads continuent de s’exécuter et entraînent une utilisation élevée du processeur.
Pour le confirmer, suspendez les opérations d’écriture différée et d’invalidation du cache pendant que vous surveillez l’utilisation du processeur. isi_cpool_d’utilisation du processeur doit diminuer rapidement une fois la mise en pause. Isi_cpool_d’utilisation du processeur augmente ensuite une fois les opérations reprises.
Pour interrompre les opérations CloudPools :
# isi cloud jobs pause cache-writeback # isi cloud jobs pause cache-invalidation
Pour reprendre les opérations CloudPools :
# isi cloud jobs resume cache-invalidation # isi cloud jobs resume cache-writeback
Tarkkuus
Il est déconseillé de laisser les opérations d’écriture différée et d’invalidation du cache interrompues pendant une période prolongée. Diverses tâches et opérations inachevées s’accumulent et amplifient le problème.
Une utilisation élevée du processeur causée par l’écriture différée ou l’invalidation du cache peut indiquer qu’un grand nombre de mises en cache s’est produit. Généralement parce qu’une grande quantité de données est archivée et rappelée à la volée. Cela peut être dû à des critères d’archivage mal écrits dans les règles de pool de fichiers. L’archivage effectué sans tenir compte du temps d’accès peut entraîner une mise en cache excessive des fichiers actifs.
Il s’agit d’un exemple de règle de pool de fichiers mal écrite qui archive les données dans un ECS CloudPools. Vérifiez que toutes les données au sein des chemins désignés sont immédiatement archivées dans CloudPools :
--------------------------------------------------------------------------------
Name: Bad ECS Cloud Policy
Description: Tier to ECS
CloudPools State: OK
CloudPools Details:
Apply Order: 3
File Matching Pattern: Path == APPS/SeaShoreVideo (begins with)
OR
Path == APPS/OceanArchive (begins with)
Set Requested Protection: -
Data Access Pattern: -
Enable Coalescer: -
Enable Packing: -
Data Storage Target: -
Data SSD Strategy: -
Snapshot Storage Target: -
Snapshot SSD Strategy: -
Cloud Pool: EMC ECS Pool
Cloud Compression Enabled: Yes
Cloud Encryption Enabled: No
Cloud Data Retention: 1W
Cloud Incremental Backup Retention: 5Y
Cloud Full Backup Retention: 5Y
Cloud Accessibility: cached
Cloud Read Ahead: partial
Cloud Cache Expiration: 1D
Cloud Writeback Frequency: 9H
ID: Good ECS Cloud Policy
--------------------------------------------------------------------------------
Voici un exemple de règle de pool de fichiers correctement rédigée qui prend en charge les fichiers actifs et récemment consultés. Tenez compte que cette règle contient des critères d’heure d’accès. Ainsi, seules les données qui n’ont pas été consultées après 5 semaines et 5 jours sont archivées dans CloudPools.
--------------------------------------------------------------------------------
Name: Good ECS Cloud Policy
Description: Tier to ECS
CloudPools State: OK
CloudPools Details:
Apply Order: 3
File Matching Pattern: Accessed Time > 5W5D AND Path == APPS/SeaShoreVideo (begins with)
OR
Accessed Time > 5W5D AND Path == APPS/OceanArchive (begins with)
Set Requested Protection: -
Data Access Pattern: -
Enable Coalescer: -
Enable Packing: -
Data Storage Target: -
Data SSD Strategy: -
Snapshot Storage Target: -
Snapshot SSD Strategy: -
Cloud Pool: EMC ECS Pool
Cloud Compression Enabled: Yes
Cloud Encryption Enabled: No
Cloud Data Retention: 1W
Cloud Incremental Backup Retention: 5Y
Cloud Full Backup Retention: 5Y
Cloud Accessibility: cached
Cloud Read Ahead: partial
Cloud Cache Expiration: 1D
Cloud Writeback Frequency: 9H
ID: Bad ECS Cloud Policy
--------------------------------------------------------------------------------
Les autres causes d’utilisation élevée du processeur isi_cpool_d peuvent varier en fonction de la configuration du cluster, des paramètres et du niveau de code. Contactez le support technique Dell si vous avez besoin d’aide.