PowerScale: Funkce Collect a MultiScan neuvolňují zpět místo na vyloučeném zařízení.
Summary: Funkce Collect a MultiScan vyloučí zařízení z úklidu, pokud jsou během spuštění úlohy nedostupná.
Symptoms
Tento článek znalostní databáze je určen pouze ke spouštění nebo dokončených úloh Collect nebo MultiScan, které v nich spustily úlohu Collect.
Collect se používá k uvolnění bloků, které zůstaly v zařízení v době, kdy bylo nedostupné.
Nástroj MultiScan občas spustí funkce AutoBalance i Collect, aby bylo zajištěno, že MultiScan spustil funkci Collect kontrolou úlohy.
# isi job view <jobID#>
Během fáze značení Collectu jsou bloky označeny pro pozdější vyčištění, jakmile vstoupí do fáze rozmítání.
V některých situacích může být zařízení vyloučeno z operace rozmítání úlohy během fáze hodnocení.
Cluster tak může zůstat s nevyváženými uzly nebo jednotkami i po úspěšném dokončení úlohy.
Úloha se zruší, pokud je z ní vyloučeno příliš mnoho jednotek nebo uzlů.
Cause
V případě, že je zařízení mimo provoz nebo je nedostupné, úloha vyloučí zařízení z fáze mazání.
Příčiny mohou být různé, například restart uzlu, vypnutí a zapnutí, rozdělení uzlu.
U disků k tomu může dojít, když se disk zastaví nebo je jinak nedostupný.
Pokud je zařízení nedostupné při spuštění nástroje Collect nebo MultiScan, úloha jej nastaví na bam_nosweep Seznam vyloučených zařízení.
Když úloha přejde do fáze úklidu, provede se úklidem všech bloků na zařízeních, která NEJSOU přidána do bam_nosweep Seznam vyloučených položek.
To může vést k tomu, že uzly nebo disky zůstanou po úspěšném dokončení úlohy nevyvážené s vyšším využitím kapacity.
Příklad 1 ukazuje jednu odchylku vyloučenou v protokolu zpráv, zobrazenou jako odchylku 28.
2025-03-08T22:09:15.238162-08:00 <0.5> EXAMPLE-1(id25) /boot/kernel.amd64/kernel: [bam_nosweep.c:298](pid 63766="isi_job_d")(tid=104229) bam_nosweep_add_devices: Exclude set { devids (1) = [ 28 ], wdls = [] }
Příklad 2 ukazuje jedno časové razítko jednotky v odchylce 18, která je vyloučena, následované jednotkou v odchylce 24.
2024-11-04T16:20:33.664254-07:00 <0.5> EXAMPLE-12(id12) /boot/kernel.amd64/kernel: [bam_nosweep.c:298](pid 83067="isi_job_d")(tid=103674) bam_nosweep_add_devices: Exclude set { devids (0) = [], wdls (1) = [ (d: 18, unm:00000040 ] }
2024-11-04T17:06:21.738071-08:00 <0.5> EXAMPLE-12(id12) /boot/kernel.amd64/kernel: [bam_nosweep.c:298](pid 83067="isi_job_d")(tid=103674) bam_nosweep_add_devices: Exclude set { devids (0) = [], wdls (2) = [ (d: 18, unm:00000040, (d: 24, unm:00000020 ] }
Příklad zrušení shromažďování kvůli procentuálnímu podílu vyloučených zařízení kvůli 28,1 % vyloučených zařízení, limit je 25 %.
2025-11-04T14:08:28.356984+01:00 <0.5> EXAMPLE-8(id8) /boot/kernel.amd64/kernel: [bam_mark.c:1923](pid 3646="isi_job_d")(tid=101140) Mark not permitted with 28.1% of 32 nodes excluded (limit 25.0%)
2025-11-04T14:08:28.356994+01:00 <0.5> EXAMPLE-8(id8) /boot/kernel.amd64/kernel: [bam_mark.c:1837](pid 3646="isi_job_d")(tid=101140) Updated mark for cookie 19:none with error 85
2025-11-04T14:08:28.359093+01:00 <0.5> EXAMPLE-8(id8) /boot/kernel.amd64/kernel: [drv.c:1499](pid 67605="python3.8")(tid=102284) Drive sync in progress for ldnum 21
2025-11-04T14:08:28.365281+01:00 <0.5> EXAMPLE-8(id8) /boot/kernel.amd64/kernel: [lin_mark.c:376](pid 3646="isi_job_d")(tid=101140) lin_end_mark: Ending lin mark (error ECANCELED).
2025-11-04T14:08:28.365300+01:00 <0.5> EXAMPLE-8(id8) /boot/kernel.amd64/kernel: [lin_mark.c:398](pid 3646="isi_job_d")(tid=101140) lin_end_mark: Mark already canceled. (current group: <1,2770> current mark state: LIN_COLLECT_GOOD
Resolution
Pokud bylo vyloučeno zařízení, které je třeba odstranit, je nutné spustit novou úlohu.
Pokud je zařízení často nedostupné kvůli jinému problému, je nutné jej dále prozkoumat.