PowerScale: Isilon: Hohe isi_cpool_d CPU-Auslastung durch CloudPools-Vorgänge

Yhteenveto: Der isi_cpool_d-Prozess kann zu einer hohen CPU-Auslastung in einem PowerScale-Isilon-Cluster führen.

Tämä artikkeli koskee tuotetta Tämä artikkeli ei koske tuotetta Tämä artikkeli ei liity tiettyyn tuotteeseen. Tässä artikkelissa ei yksilöidä kaikkia tuoteversioita.

Oireet

isi_cpool_d Prozess zeigt eine kontinuierlich hohe CPU-Auslastung auf dem Cluster an.

 

Isilon-1# top -n 10

  PID USERNAME    THR PRI NICE   SIZE    RES STATE    C   TIME    WCPU COMMAND
87857 root        124  20    0   595M   173M nanslp  13 1722.5 857.62% isi_cpool_d
 3455 root         29  98 r150   397M    86M sigwai  10 4216.2  62.55% nfs
 3313 root         40  98 r150  1018M   683M sigwai  14 7402.9  47.71% lwio
94259 root         13  52    0   566M   491M usem    18 374.1H  32.57% isi_celog_monitor
18378 root          5  20    0   102M    53M uwait    3  49:57  24.56% isi_job_d
34552 root          1  52    0    37M    15M adv     22 112.6H  20.51% isi_migr_sched
 3144 root         13  20    0    52M    13M select   8 2009.5  15.33% isi_audit_d
98432 root          1  52    0   105M    66M kqread  26 417:47  14.55% isi_celog_analysis
 3213 root         26  52    0    96M    28M uwait   10 1109.2  12.50% isi_avscan_d
51167 root          5  20    0    93M    42M uwait   21  74:37  10.40% isi_job_d
...
..

 

Möglicherweise werden mehrere CloudPools-Jobs auf dem Cluster ausgeführt, aber selbst wenn alle Jobs angehalten werden, bleibt die isi_cpool_d-Auslastung hoch.

 

Isilon-1#  isi cloud jobs list
ID   Description                              Effective State  Type
---------------------------------------------------------------------------------------
1    Write updated data to the cloud          paused           cache-writeback
2    Expire CloudPools cache                  paused           cache-invalidation
4    Clean up unreferenced data in the cloud  paused           cloud-garbage-collection
5    Write updated snapshot data to the cloud paused           snapshot-writeback
6    Update SmartLink file formats            paused           smartlink-upgrade
7    Add data to CloudPools cache             paused           cache-pre-populate
959                                           paused           archive
960                                           paused           archive
961                                           paused           archive
962                                           paused           archive
964                                           paused           archive
965                                           paused           archive
966                                           paused           archive
967                                           paused           archive
968                                           paused           archive
---------------------------------------------------------------------------------------

Isilon-1# top -n 5

  PID USERNAME    THR PRI NICE   SIZE    RES STATE    C   TIME    WCPU COMMAND
87857 root        124  20    0   588M   180M nanslp   4 1723.5 805.81% isi_cpool_d
 3455 root         28  98 r150   397M    87M sigwai  10 4216.3  69.34% nfs
18378 root          6  20    0   122M    72M uwait    9  53:18  68.36% isi_job_d
 3313 root         49  98 r150  1019M   684M sigwai  14 7403.0  66.16% lwio
51167 root          6  20    0    94M    42M uwait   26  76:02  22.36% isi_job_d
...

 

Syy

Bestimmte Vorgänge wie Cache-Rückschreiben und Cache-Ungültigkeit laufen im Hintergrund ab und korrelieren nicht direkt mit einem laufenden CloudPools-Job. Das Anhalten von CloudPools-Jobs beendet nicht die Ausführung dieser Vorgänge. Diese Threads werden weiterhin ausgeführt und verursachen eine hohe CPU-Auslastung.

Um dies zu bestätigen, halten Sie die Vorgänge für das Rückschreiben des Caches und die Ungültigmachung des Caches an, während Sie die CPU-Auslastung überwachen. isi_cpool_d CPU-Auslastung sollte nach dem Anhalten schnell abfallen. Isi_cpool_d CPU-Auslastung steigt dann an, sobald der Betrieb wieder aufgenommen wird. 
 

So halten Sie CloudPools-Vorgänge an:

# isi cloud jobs pause cache-writeback
# isi cloud jobs pause cache-invalidation
 


 

So setzen Sie CloudPools-Vorgänge fort:

# isi cloud jobs resume cache-invalidation
# isi cloud jobs resume cache-writeback
 


 

Tarkkuus

Es ist nicht ratsam, die Cache-Rückschreib- und Cache-Invalidierungsvorgänge über einen längeren Zeitraum anzuhalten. Verschiedene unvollständige Aufgaben und Vorgänge häufen sich an und vergrößern das Problem. 
 

Eine hohe CPU-Auslastung, die durch Rückschreiben oder Cacheinvalidierung verursacht wird, kann darauf hinweisen, dass viel Caching stattgefunden hat. Normalerweise, weil eine große Menge an Daten archiviert und inline abgerufen wird. Grund dafür können schlecht geschriebene Archivierungskriterien in den Dateipool-Policies sein. Eine Archivierung ohne Berücksichtigung der Zugriffszeit kann zu einem übermäßigen Caching aktiver Dateien führen.
 

Dies ist ein Beispiel für eine schlecht geschriebene Dateipool-Policy, die Daten in einem ECS-CloudPool archiviert. Beachten Sie, dass alle Daten innerhalb der festgelegten Pfade sofort in CloudPools archiviert werden:

--------------------------------------------------------------------------------
                              Name: Bad ECS Cloud Policy
                       Description: Tier to ECS
                  CloudPools State: OK
                CloudPools Details:
                       Apply Order: 3
             File Matching Pattern: Path == APPS/SeaShoreVideo (begins with)
                                    OR
                                    Path == APPS/OceanArchive (begins with)
          Set Requested Protection: -
               Data Access Pattern: -
                  Enable Coalescer: -
                    Enable Packing: -
               Data Storage Target: -
                 Data SSD Strategy: -
           Snapshot Storage Target: -
             Snapshot SSD Strategy: -
                        Cloud Pool: EMC ECS Pool
         Cloud Compression Enabled: Yes
          Cloud Encryption Enabled: No
              Cloud Data Retention: 1W
Cloud Incremental Backup Retention: 5Y
       Cloud Full Backup Retention: 5Y
               Cloud Accessibility: cached
                  Cloud Read Ahead: partial
            Cloud Cache Expiration: 1D
         Cloud Writeback Frequency: 9H
                                ID: Good ECS Cloud Policy
--------------------------------------------------------------------------------


 

Dies ist ein Beispiel für eine ordnungsgemäß geschriebene Dateipool-Policy, die aktive und zuletzt aufgerufene Dateien berücksichtigt. Beachten Sie, dass diese Policy Kriterien für die Zugriffszeit enthält, sodass nur Daten in CloudPools archiviert werden, auf die nach 5 Wochen und 5 Tagen nicht zugegriffen wurde. 

--------------------------------------------------------------------------------
                              Name: Good ECS Cloud Policy
                       Description: Tier to ECS
                  CloudPools State: OK
                CloudPools Details:
                       Apply Order: 3
             File Matching Pattern: Accessed Time > 5W5D AND Path == APPS/SeaShoreVideo (begins with)
                                    OR
                                    Accessed Time > 5W5D AND Path == APPS/OceanArchive (begins with)
          Set Requested Protection: -
               Data Access Pattern: -
                  Enable Coalescer: -
                    Enable Packing: -
               Data Storage Target: -
                 Data SSD Strategy: -
           Snapshot Storage Target: -
             Snapshot SSD Strategy: -
                        Cloud Pool: EMC ECS Pool
         Cloud Compression Enabled: Yes
          Cloud Encryption Enabled: No
              Cloud Data Retention: 1W
Cloud Incremental Backup Retention: 5Y
       Cloud Full Backup Retention: 5Y
               Cloud Accessibility: cached
                  Cloud Read Ahead: partial
            Cloud Cache Expiration: 1D
         Cloud Writeback Frequency: 9H
                                ID: Bad ECS Cloud Policy
--------------------------------------------------------------------------------

 

 

 

Andere Ursachen für eine hohe isi_cpool_d CPU-Auslastung können je nach Clusterkonfiguration, Einstellungen und Codelevel variieren. Wenden Sie sich an den technischen Support von Dell, wenn Sie Hilfe benötigen.

Tuotteet, joihin vaikutus kohdistuu

PowerScale OneFS

Tuotteet

Isilon, Isilon SmartPools
Artikkelin ominaisuudet
Artikkelin numero: 000214130
Artikkelin tyyppi: Solution
Viimeksi muutettu: 04 maalisk. 2025
Versio:  2
Etsi vastauksia kysymyksiisi muilta Dell-käyttäjiltä
Tukipalvelut
Tarkista, kuuluuko laitteesi tukipalveluiden piiriin.