PowerScale: Isilon: Високе isi_cpool_d завантаження процесора, спричинене операціями CloudPools
Summary: Процес isi_cpool_d може спричинити високу завантаженість процесора на кластері PowerScale Isilon.
Symptoms
isi_cpool_d Процес демонструє безперервне високе навантаження процесора на кластері.
Isilon-1# top -n 10 PID USERNAME THR PRI NICE SIZE RES STATE C TIME WCPU COMMAND 87857 root 124 20 0 595M 173M nanslp 13 1722.5 857.62% isi_cpool_d 3455 root 29 98 r150 397M 86M sigwai 10 4216.2 62.55% nfs 3313 root 40 98 r150 1018M 683M sigwai 14 7402.9 47.71% lwio 94259 root 13 52 0 566M 491M usem 18 374.1H 32.57% isi_celog_monitor 18378 root 5 20 0 102M 53M uwait 3 49:57 24.56% isi_job_d 34552 root 1 52 0 37M 15M adv 22 112.6H 20.51% isi_migr_sched 3144 root 13 20 0 52M 13M select 8 2009.5 15.33% isi_audit_d 98432 root 1 52 0 105M 66M kqread 26 417:47 14.55% isi_celog_analysis 3213 root 26 52 0 96M 28M uwait 10 1109.2 12.50% isi_avscan_d 51167 root 5 20 0 93M 42M uwait 21 74:37 10.40% isi_job_d ... ..
Множинний CloudPools Робочі місця можуть працювати на кластері, але навіть коли всі завдання призупинені isi_cpool_d Використання залишається високим.
Isilon-1# isi cloud jobs list ID Description Effective State Type --------------------------------------------------------------------------------------- 1 Write updated data to the cloud paused cache-writeback 2 Expire CloudPools cache paused cache-invalidation 4 Clean up unreferenced data in the cloud paused cloud-garbage-collection 5 Write updated snapshot data to the cloud paused snapshot-writeback 6 Update SmartLink file formats paused smartlink-upgrade 7 Add data to CloudPools cache paused cache-pre-populate 959 paused archive 960 paused archive 961 paused archive 962 paused archive 964 paused archive 965 paused archive 966 paused archive 967 paused archive 968 paused archive ---------------------------------------------------------------------------------------
Isilon-1# top -n 5 PID USERNAME THR PRI NICE SIZE RES STATE C TIME WCPU COMMAND 87857 root 124 20 0 588M 180M nanslp 4 1723.5 805.81% isi_cpool_d 3455 root 28 98 r150 397M 87M sigwai 10 4216.3 69.34% nfs 18378 root 6 20 0 122M 72M uwait 9 53:18 68.36% isi_job_d 3313 root 49 98 r150 1019M 684M sigwai 14 7403.0 66.16% lwio 51167 root 6 20 0 94M 42M uwait 26 76:02 22.36% isi_job_d ...
Cause
Деякі операції, такі як cache-writeback і cache-invalidation, відбуваються у фоновому режимі і не мають прямого зв'язку з жодним із виконаних CloudPools робота. Пауза CloudPools Джобс не зупиняє роботу цих операцій. Ці потоки продовжують працювати і спричиняють високе завантаження процесора.
Щоб це підтвердити, призупините операції запису кешу та інвалідації кешу під час моніторингу використання процесора. isi_cpool_d Завантаження процесора має швидко знизитися після паузи. Isi_cpool_d Завантаження процесора зростає після відновлення операцій.
Зробити паузу CloudPools Операції:
# isi cloud jobs pause cache-writeback # isi cloud jobs pause cache-invalidation
Продовжимо CloudPools Операції:
# isi cloud jobs resume cache-invalidation # isi cloud jobs resume cache-writeback
Resolution
Не рекомендується залишати операції запису кешу та інвалідації кешу на тривалий час. Різні незавершені завдання та операції накопичують і ускладнюють проблему.
Висока завантаженість процесора, спричинена записом або інвалідацією кешу, може свідчити про значне кешування. Зазвичай тому, що велика кількість даних архівується та відкликається в прямому режимі. Це може бути наслідком погано написаних критеріїв архівування в Політиці Файлового пулу. Архівування без урахування часу доступу може призвести до надмірного кешування активних файлів.
Це приклад погано написаної політики File Pool, яка архівує дані до ECS CloudPools. Зверніть увагу, що будь-які дані в межах визначених шляхів негайно архівуються до CloudPools:
--------------------------------------------------------------------------------
Name: Bad ECS Cloud Policy
Description: Tier to ECS
CloudPools State: OK
CloudPools Details:
Apply Order: 3
File Matching Pattern: Path == APPS/SeaShoreVideo (begins with)
OR
Path == APPS/OceanArchive (begins with)
Set Requested Protection: -
Data Access Pattern: -
Enable Coalescer: -
Enable Packing: -
Data Storage Target: -
Data SSD Strategy: -
Snapshot Storage Target: -
Snapshot SSD Strategy: -
Cloud Pool: EMC ECS Pool
Cloud Compression Enabled: Yes
Cloud Encryption Enabled: No
Cloud Data Retention: 1W
Cloud Incremental Backup Retention: 5Y
Cloud Full Backup Retention: 5Y
Cloud Accessibility: cached
Cloud Read Ahead: partial
Cloud Cache Expiration: 1D
Cloud Writeback Frequency: 9H
ID: Good ECS Cloud Policy
--------------------------------------------------------------------------------
Це приклад правильно написаної політики пулу файлів, яка враховує активні та нещодавно отримані файли. Зверніть увагу, ця політика містить критерії часу доступу, тому лише дані, які не були отримані після 5 тижнів і 5 днів, архівуються до CloudPools.
--------------------------------------------------------------------------------
Name: Good ECS Cloud Policy
Description: Tier to ECS
CloudPools State: OK
CloudPools Details:
Apply Order: 3
File Matching Pattern: Accessed Time > 5W5D AND Path == APPS/SeaShoreVideo (begins with)
OR
Accessed Time > 5W5D AND Path == APPS/OceanArchive (begins with)
Set Requested Protection: -
Data Access Pattern: -
Enable Coalescer: -
Enable Packing: -
Data Storage Target: -
Data SSD Strategy: -
Snapshot Storage Target: -
Snapshot SSD Strategy: -
Cloud Pool: EMC ECS Pool
Cloud Compression Enabled: Yes
Cloud Encryption Enabled: No
Cloud Data Retention: 1W
Cloud Incremental Backup Retention: 5Y
Cloud Full Backup Retention: 5Y
Cloud Accessibility: cached
Cloud Read Ahead: partial
Cloud Cache Expiration: 1D
Cloud Writeback Frequency: 9H
ID: Bad ECS Cloud Policy
--------------------------------------------------------------------------------
Інші причини високого впливу isi_cpool_d Використання процесора може варіюватися залежно від конфігурації кластера, налаштувань і рівня коду. Звертайтеся до технічної підтримки Dell , якщо потрібна допомога.