PowerScale: Indsaml og MultiScan frigør ikke plads på den udelukkede enhed
Summary: Indsamling og MultiScan udelukker enheder fra oprydning, hvis de bliver utilgængelige under jobkørslen.
Symptoms
Denne KB er kun beregnet til kørsel eller fuldførte Collect-job eller MultiScan-job, der kørte Collect i dem.
Indsamling bruges til at frigøre blokke, der er tilbage på en enhed, mens den blev utilgængelig.
MultiScan kører til tider både AutoBalance og Collect for at sikre, at MultiScan kørte Collect ved at kontrollere jobbet.
# isi job view <jobID#>
Under markeringsfasen af Collect markeres blokke til senere oprydning, når den går ind i fejefasen.
I nogle situationer kan en enhed være udelukket fra jobbets oprydningsoperation i markeringsfasen.
Dette kan efterlade klyngen med ubalancerede noder eller drev, selv efter jobbet er fuldført.
Jobbet annulleres, hvis for mange drev eller noder udelukkes fra jobbet.
Cause
I tilfælde af, at en enhed går ned eller ikke er tilgængelig, udelukker jobbet enheden fra oprydningsfasen.
Dette kan skyldes forskellige årsager, f.eks. genstart af node, strømcyklus, nodeopdeling.
Med drev kan dette ske, hvis et drev går i stå eller på anden måde ikke er tilgængeligt.
Hvis en enhed ikke er tilgængelig, mens den kører Collect eller MultiScan, indstilles den til bam_nosweep Liste over ekskluderede enheder.
Når jobbet går ind i oprydningsfasen, fungerer det til at feje eventuelle blokke på enhederne, der IKKE er føjet til bam_nosweep Ekskluderet liste.
Dette kan føre til, at noder eller drev forbliver ubalancerede med en højere kapacitetsudnyttelse, efter jobbet er fuldført.
Eksempel 1 viser én devid, der er ekskluderet i meddelelsesloggen, vist som devid 28.
2025-03-08T22:09:15.238162-08:00 <0.5> EXAMPLE-1(id25) /boot/kernel.amd64/kernel: [bam_nosweep.c:298](pid 63766="isi_job_d")(tid=104229) bam_nosweep_add_devices: Exclude set { devids (1) = [ 28 ], wdls = [] }
Eksempel 2 viser et tidsstempel, hvor et drev i devid 18 ikke medregnes, efterfulgt af et drev i devid 24.
2024-11-04T16:20:33.664254-07:00 <0.5> EXAMPLE-12(id12) /boot/kernel.amd64/kernel: [bam_nosweep.c:298](pid 83067="isi_job_d")(tid=103674) bam_nosweep_add_devices: Exclude set { devids (0) = [], wdls (1) = [ (d: 18, unm:00000040 ] }
2024-11-04T17:06:21.738071-08:00 <0.5> EXAMPLE-12(id12) /boot/kernel.amd64/kernel: [bam_nosweep.c:298](pid 83067="isi_job_d")(tid=103674) bam_nosweep_add_devices: Exclude set { devids (0) = [], wdls (2) = [ (d: 18, unm:00000040, (d: 24, unm:00000020 ] }
Eksempel på, at afhentning annulleres på grund af procentdelen af ekskluderede enheder, fordi 28,1 % af enhederne ekskluderes, grænsen er 25 %.
2025-11-04T14:08:28.356984+01:00 <0.5> EXAMPLE-8(id8) /boot/kernel.amd64/kernel: [bam_mark.c:1923](pid 3646="isi_job_d")(tid=101140) Mark not permitted with 28.1% of 32 nodes excluded (limit 25.0%)
2025-11-04T14:08:28.356994+01:00 <0.5> EXAMPLE-8(id8) /boot/kernel.amd64/kernel: [bam_mark.c:1837](pid 3646="isi_job_d")(tid=101140) Updated mark for cookie 19:none with error 85
2025-11-04T14:08:28.359093+01:00 <0.5> EXAMPLE-8(id8) /boot/kernel.amd64/kernel: [drv.c:1499](pid 67605="python3.8")(tid=102284) Drive sync in progress for ldnum 21
2025-11-04T14:08:28.365281+01:00 <0.5> EXAMPLE-8(id8) /boot/kernel.amd64/kernel: [lin_mark.c:376](pid 3646="isi_job_d")(tid=101140) lin_end_mark: Ending lin mark (error ECANCELED).
2025-11-04T14:08:28.365300+01:00 <0.5> EXAMPLE-8(id8) /boot/kernel.amd64/kernel: [lin_mark.c:398](pid 3646="isi_job_d")(tid=101140) lin_end_mark: Mark already canceled. (current group: <1,2770> current mark state: LIN_COLLECT_GOOD
Resolution
Hvis den enhed, der skal fejes, er blevet udelukket, skal et nyt job startes.
Hvis et andet problem får enheden til at blive utilgængelig ofte, skal det undersøges nærmere.