PowerScale: Isilon: Hög isi_cpool_d CPU-användning orsakad av CloudPools-drift
Yhteenveto: Den isi_cpool_d processen kan orsaka hög processoranvändning på ett PowerScale Isilon Cluster.
Oireet
isi_cpool_d processen visar kontinuerligt hög CPU-användning i klustret.
Isilon-1# top -n 10 PID USERNAME THR PRI NICE SIZE RES STATE C TIME WCPU COMMAND 87857 root 124 20 0 595M 173M nanslp 13 1722.5 857.62% isi_cpool_d 3455 root 29 98 r150 397M 86M sigwai 10 4216.2 62.55% nfs 3313 root 40 98 r150 1018M 683M sigwai 14 7402.9 47.71% lwio 94259 root 13 52 0 566M 491M usem 18 374.1H 32.57% isi_celog_monitor 18378 root 5 20 0 102M 53M uwait 3 49:57 24.56% isi_job_d 34552 root 1 52 0 37M 15M adv 22 112.6H 20.51% isi_migr_sched 3144 root 13 20 0 52M 13M select 8 2009.5 15.33% isi_audit_d 98432 root 1 52 0 105M 66M kqread 26 417:47 14.55% isi_celog_analysis 3213 root 26 52 0 96M 28M uwait 10 1109.2 12.50% isi_avscan_d 51167 root 5 20 0 93M 42M uwait 21 74:37 10.40% isi_job_d ... ..
Flera CloudPools-jobb kan köras på klustret, men även när alla jobb har pausats är isi_cpool_d-användningen hög.
Isilon-1# isi cloud jobs list ID Description Effective State Type --------------------------------------------------------------------------------------- 1 Write updated data to the cloud paused cache-writeback 2 Expire CloudPools cache paused cache-invalidation 4 Clean up unreferenced data in the cloud paused cloud-garbage-collection 5 Write updated snapshot data to the cloud paused snapshot-writeback 6 Update SmartLink file formats paused smartlink-upgrade 7 Add data to CloudPools cache paused cache-pre-populate 959 paused archive 960 paused archive 961 paused archive 962 paused archive 964 paused archive 965 paused archive 966 paused archive 967 paused archive 968 paused archive ---------------------------------------------------------------------------------------
Isilon-1# top -n 5 PID USERNAME THR PRI NICE SIZE RES STATE C TIME WCPU COMMAND 87857 root 124 20 0 588M 180M nanslp 4 1723.5 805.81% isi_cpool_d 3455 root 28 98 r150 397M 87M sigwai 10 4216.3 69.34% nfs 18378 root 6 20 0 122M 72M uwait 9 53:18 68.36% isi_job_d 3313 root 49 98 r150 1019M 684M sigwai 14 7403.0 66.16% lwio 51167 root 6 20 0 94M 42M uwait 26 76:02 22.36% isi_job_d ...
Syy
Vissa åtgärder, till exempel tillbakaskrivning av cacheminne och ogiltigförklaring av cacheminne, sker i bakgrunden och korrelerar inte direkt med något CloudPools-jobb som körs. Om du pausar CloudPools-jobb stoppas inte dessa åtgärder från att köras. Dessa trådar fortsätter att köras och orsakar hög CPU-användning.
Bekräfta detta genom att pausa åtgärderna för cacheskrivning och cacheogiltigförklaring medan du övervakar CPU-användningen. isi_cpool_d bör processoranvändningen sjunka snabbt när den pausas. Isi_cpool_d CPU-användningen stiger sedan när driften återupptas.
Så här pausar du CloudPools-åtgärder:
# isi cloud jobs pause cache-writeback # isi cloud jobs pause cache-invalidation
Så här återupptar du CloudPools-driften:
# isi cloud jobs resume cache-invalidation # isi cloud jobs resume cache-writeback
Tarkkuus
Vi rekommenderar inte att du låter åtgärderna för cache-tillbakaskrivning och cache-ogiltigförklaring vara pausade under en längre tid. Olika ofullständiga uppgifter och operationer ackumuleras och förstorar problemet.
Hög CPU-användning som orsakas av tillbakaskrivning eller cacheogiltigförklaring kan tyda på att mycket cachelagring har inträffat. Vanligtvis på grund av att en stor mängd data arkiveras och återkallas infogade. Detta kan bero på dåligt skrivna arkiveringskriterier i filpoolsprinciperna. Arkivering som görs utan hänsyn till åtkomsttid kan resultera i överdriven cachelagring av aktiva filer.
Det här är ett exempel på en dåligt skriven filpoolprincip som arkiverar data till en ECS CloudPools. Observera att alla data inom de angivna sökvägarna omedelbart arkiveras i CloudPools:
--------------------------------------------------------------------------------
Name: Bad ECS Cloud Policy
Description: Tier to ECS
CloudPools State: OK
CloudPools Details:
Apply Order: 3
File Matching Pattern: Path == APPS/SeaShoreVideo (begins with)
OR
Path == APPS/OceanArchive (begins with)
Set Requested Protection: -
Data Access Pattern: -
Enable Coalescer: -
Enable Packing: -
Data Storage Target: -
Data SSD Strategy: -
Snapshot Storage Target: -
Snapshot SSD Strategy: -
Cloud Pool: EMC ECS Pool
Cloud Compression Enabled: Yes
Cloud Encryption Enabled: No
Cloud Data Retention: 1W
Cloud Incremental Backup Retention: 5Y
Cloud Full Backup Retention: 5Y
Cloud Accessibility: cached
Cloud Read Ahead: partial
Cloud Cache Expiration: 1D
Cloud Writeback Frequency: 9H
ID: Good ECS Cloud Policy
--------------------------------------------------------------------------------
Det här är ett exempel på en korrekt skriven filpoolprincip som hanterar aktiva och nyligen använda filer. Observera att denna policy innehåller kriterier för åtkomsttid så att endast data som inte har använts efter 5 veckor och 5 dagar arkiveras i CloudPools.
--------------------------------------------------------------------------------
Name: Good ECS Cloud Policy
Description: Tier to ECS
CloudPools State: OK
CloudPools Details:
Apply Order: 3
File Matching Pattern: Accessed Time > 5W5D AND Path == APPS/SeaShoreVideo (begins with)
OR
Accessed Time > 5W5D AND Path == APPS/OceanArchive (begins with)
Set Requested Protection: -
Data Access Pattern: -
Enable Coalescer: -
Enable Packing: -
Data Storage Target: -
Data SSD Strategy: -
Snapshot Storage Target: -
Snapshot SSD Strategy: -
Cloud Pool: EMC ECS Pool
Cloud Compression Enabled: Yes
Cloud Encryption Enabled: No
Cloud Data Retention: 1W
Cloud Incremental Backup Retention: 5Y
Cloud Full Backup Retention: 5Y
Cloud Accessibility: cached
Cloud Read Ahead: partial
Cloud Cache Expiration: 1D
Cloud Writeback Frequency: 9H
ID: Bad ECS Cloud Policy
--------------------------------------------------------------------------------
Andra orsaker till hög isi_cpool_d CPU-användning kan variera beroende på klusterkonfiguration, inställningar och kodnivå. Kontakta Dells tekniska support om du behöver hjälp.