PowerScale: Isilon: Hohe isi_cpool_d CPU-Auslastung durch CloudPools-Vorgänge
Yhteenveto: Der isi_cpool_d-Prozess kann zu einer hohen CPU-Auslastung in einem PowerScale-Isilon-Cluster führen.
Oireet
isi_cpool_d Prozess zeigt eine kontinuierlich hohe CPU-Auslastung auf dem Cluster an.
Isilon-1# top -n 10 PID USERNAME THR PRI NICE SIZE RES STATE C TIME WCPU COMMAND 87857 root 124 20 0 595M 173M nanslp 13 1722.5 857.62% isi_cpool_d 3455 root 29 98 r150 397M 86M sigwai 10 4216.2 62.55% nfs 3313 root 40 98 r150 1018M 683M sigwai 14 7402.9 47.71% lwio 94259 root 13 52 0 566M 491M usem 18 374.1H 32.57% isi_celog_monitor 18378 root 5 20 0 102M 53M uwait 3 49:57 24.56% isi_job_d 34552 root 1 52 0 37M 15M adv 22 112.6H 20.51% isi_migr_sched 3144 root 13 20 0 52M 13M select 8 2009.5 15.33% isi_audit_d 98432 root 1 52 0 105M 66M kqread 26 417:47 14.55% isi_celog_analysis 3213 root 26 52 0 96M 28M uwait 10 1109.2 12.50% isi_avscan_d 51167 root 5 20 0 93M 42M uwait 21 74:37 10.40% isi_job_d ... ..
Möglicherweise werden mehrere CloudPools-Jobs auf dem Cluster ausgeführt, aber selbst wenn alle Jobs angehalten werden, bleibt die isi_cpool_d-Auslastung hoch.
Isilon-1# isi cloud jobs list ID Description Effective State Type --------------------------------------------------------------------------------------- 1 Write updated data to the cloud paused cache-writeback 2 Expire CloudPools cache paused cache-invalidation 4 Clean up unreferenced data in the cloud paused cloud-garbage-collection 5 Write updated snapshot data to the cloud paused snapshot-writeback 6 Update SmartLink file formats paused smartlink-upgrade 7 Add data to CloudPools cache paused cache-pre-populate 959 paused archive 960 paused archive 961 paused archive 962 paused archive 964 paused archive 965 paused archive 966 paused archive 967 paused archive 968 paused archive ---------------------------------------------------------------------------------------
Isilon-1# top -n 5 PID USERNAME THR PRI NICE SIZE RES STATE C TIME WCPU COMMAND 87857 root 124 20 0 588M 180M nanslp 4 1723.5 805.81% isi_cpool_d 3455 root 28 98 r150 397M 87M sigwai 10 4216.3 69.34% nfs 18378 root 6 20 0 122M 72M uwait 9 53:18 68.36% isi_job_d 3313 root 49 98 r150 1019M 684M sigwai 14 7403.0 66.16% lwio 51167 root 6 20 0 94M 42M uwait 26 76:02 22.36% isi_job_d ...
Syy
Bestimmte Vorgänge wie Cache-Rückschreiben und Cache-Ungültigkeit laufen im Hintergrund ab und korrelieren nicht direkt mit einem laufenden CloudPools-Job. Das Anhalten von CloudPools-Jobs beendet nicht die Ausführung dieser Vorgänge. Diese Threads werden weiterhin ausgeführt und verursachen eine hohe CPU-Auslastung.
Um dies zu bestätigen, halten Sie die Vorgänge für das Rückschreiben des Caches und die Ungültigmachung des Caches an, während Sie die CPU-Auslastung überwachen. isi_cpool_d CPU-Auslastung sollte nach dem Anhalten schnell abfallen. Isi_cpool_d CPU-Auslastung steigt dann an, sobald der Betrieb wieder aufgenommen wird.
So halten Sie CloudPools-Vorgänge an:
# isi cloud jobs pause cache-writeback # isi cloud jobs pause cache-invalidation
So setzen Sie CloudPools-Vorgänge fort:
# isi cloud jobs resume cache-invalidation # isi cloud jobs resume cache-writeback
Tarkkuus
Es ist nicht ratsam, die Cache-Rückschreib- und Cache-Invalidierungsvorgänge über einen längeren Zeitraum anzuhalten. Verschiedene unvollständige Aufgaben und Vorgänge häufen sich an und vergrößern das Problem.
Eine hohe CPU-Auslastung, die durch Rückschreiben oder Cacheinvalidierung verursacht wird, kann darauf hinweisen, dass viel Caching stattgefunden hat. Normalerweise, weil eine große Menge an Daten archiviert und inline abgerufen wird. Grund dafür können schlecht geschriebene Archivierungskriterien in den Dateipool-Policies sein. Eine Archivierung ohne Berücksichtigung der Zugriffszeit kann zu einem übermäßigen Caching aktiver Dateien führen.
Dies ist ein Beispiel für eine schlecht geschriebene Dateipool-Policy, die Daten in einem ECS-CloudPool archiviert. Beachten Sie, dass alle Daten innerhalb der festgelegten Pfade sofort in CloudPools archiviert werden:
--------------------------------------------------------------------------------
Name: Bad ECS Cloud Policy
Description: Tier to ECS
CloudPools State: OK
CloudPools Details:
Apply Order: 3
File Matching Pattern: Path == APPS/SeaShoreVideo (begins with)
OR
Path == APPS/OceanArchive (begins with)
Set Requested Protection: -
Data Access Pattern: -
Enable Coalescer: -
Enable Packing: -
Data Storage Target: -
Data SSD Strategy: -
Snapshot Storage Target: -
Snapshot SSD Strategy: -
Cloud Pool: EMC ECS Pool
Cloud Compression Enabled: Yes
Cloud Encryption Enabled: No
Cloud Data Retention: 1W
Cloud Incremental Backup Retention: 5Y
Cloud Full Backup Retention: 5Y
Cloud Accessibility: cached
Cloud Read Ahead: partial
Cloud Cache Expiration: 1D
Cloud Writeback Frequency: 9H
ID: Good ECS Cloud Policy
--------------------------------------------------------------------------------
Dies ist ein Beispiel für eine ordnungsgemäß geschriebene Dateipool-Policy, die aktive und zuletzt aufgerufene Dateien berücksichtigt. Beachten Sie, dass diese Policy Kriterien für die Zugriffszeit enthält, sodass nur Daten in CloudPools archiviert werden, auf die nach 5 Wochen und 5 Tagen nicht zugegriffen wurde.
--------------------------------------------------------------------------------
Name: Good ECS Cloud Policy
Description: Tier to ECS
CloudPools State: OK
CloudPools Details:
Apply Order: 3
File Matching Pattern: Accessed Time > 5W5D AND Path == APPS/SeaShoreVideo (begins with)
OR
Accessed Time > 5W5D AND Path == APPS/OceanArchive (begins with)
Set Requested Protection: -
Data Access Pattern: -
Enable Coalescer: -
Enable Packing: -
Data Storage Target: -
Data SSD Strategy: -
Snapshot Storage Target: -
Snapshot SSD Strategy: -
Cloud Pool: EMC ECS Pool
Cloud Compression Enabled: Yes
Cloud Encryption Enabled: No
Cloud Data Retention: 1W
Cloud Incremental Backup Retention: 5Y
Cloud Full Backup Retention: 5Y
Cloud Accessibility: cached
Cloud Read Ahead: partial
Cloud Cache Expiration: 1D
Cloud Writeback Frequency: 9H
ID: Bad ECS Cloud Policy
--------------------------------------------------------------------------------
Andere Ursachen für eine hohe isi_cpool_d CPU-Auslastung können je nach Clusterkonfiguration, Einstellungen und Codelevel variieren. Wenden Sie sich an den technischen Support von Dell, wenn Sie Hilfe benötigen.