PowerScale: Collect en MultiScan winnen geen ruimte vrij op het uitgesloten apparaat
Summary: Collect en MultiScan sluiten apparaten uit van sweep als ze niet beschikbaar zijn tijdens de taakuitvoering.
Symptoms
Deze KB is alleen voor het uitvoeren of voltooien van Collect-taken of MultiScan-taken waarvoor Collect is uitgevoerd.
Collect wordt gebruikt om blokken vrij te maken die op een apparaat zijn achtergebleven terwijl het niet meer beschikbaar was.
MultiScan voert soms zowel AutoBalance als Collect uit, om ervoor te zorgen dat MultiScan Collect uitvoert door de taak te controleren.
# isi job view <jobID#>
Tijdens de markeerfase van Collect worden blokken gemarkeerd voor latere opruiming zodra het de sweep-fase ingaat.
In sommige situaties kan een apparaat worden uitgesloten van de veegbewerking van de taak tijdens de markeerfase.
Hierdoor kan het cluster met onevenwichtige knooppunten of stations blijven zitten, zelfs nadat de taak met succes is voltooid.
De taak wordt geannuleerd als er te veel schijven of knooppunten van de taak zijn uitgesloten.
Cause
Als een apparaat uitvalt of niet beschikbaar is, sluit de taak het apparaat uit van de opruimfase.
Dit kan verschillende oorzaken hebben, zoals opnieuw opstarten van een knooppunt, stroomcyclus, knooppuntsplitsing.
Bij schijven kan dit gebeuren als een schijf afslaat of anderszins niet beschikbaar is.
Als een apparaat niet beschikbaar is tijdens het uitvoeren van Collect of MultiScan, wordt het ingesteld op bam_nosweep Lijst met uitgesloten apparaten.
Wanneer de taak de opruimfase ingaat, werkt deze om eventuele blokken op de apparaten die NIET aan de zijn toegevoegd NIET te vegen bam_nosweep Lijst met uitgeslotenen.
Dit kan ertoe leiden dat knooppunten of schijven uit balans blijven met een hoger capaciteitsgebruik nadat de taak met succes is voltooid.
Voorbeeld 1 toont één devid die is uitgesloten in het berichtenlogboek, weergegeven als devid 28.
2025-03-08T22:09:15.238162-08:00 <0.5> EXAMPLE-1(id25) /boot/kernel.amd64/kernel: [bam_nosweep.c:298](pid 63766="isi_job_d")(tid=104229) bam_nosweep_add_devices: Exclude set { devids (1) = [ 28 ], wdls = [] }
Voorbeeld 2 toont één tijdstempel van een schijf in devid 18 die wordt uitgesloten, gevolgd door een schijf in devid 24.
2024-11-04T16:20:33.664254-07:00 <0.5> EXAMPLE-12(id12) /boot/kernel.amd64/kernel: [bam_nosweep.c:298](pid 83067="isi_job_d")(tid=103674) bam_nosweep_add_devices: Exclude set { devids (0) = [], wdls (1) = [ (d: 18, unm:00000040 ] }
2024-11-04T17:06:21.738071-08:00 <0.5> EXAMPLE-12(id12) /boot/kernel.amd64/kernel: [bam_nosweep.c:298](pid 83067="isi_job_d")(tid=103674) bam_nosweep_add_devices: Exclude set { devids (0) = [], wdls (2) = [ (d: 18, unm:00000040, (d: 24, unm:00000020 ] }
Voorbeeld van Collect dat wordt geannuleerd vanwege het percentage apparaten dat is uitgesloten vanwege 28,1% van de apparaten die zijn uitgesloten, de limiet is 25%.
2025-11-04T14:08:28.356984+01:00 <0.5> EXAMPLE-8(id8) /boot/kernel.amd64/kernel: [bam_mark.c:1923](pid 3646="isi_job_d")(tid=101140) Mark not permitted with 28.1% of 32 nodes excluded (limit 25.0%)
2025-11-04T14:08:28.356994+01:00 <0.5> EXAMPLE-8(id8) /boot/kernel.amd64/kernel: [bam_mark.c:1837](pid 3646="isi_job_d")(tid=101140) Updated mark for cookie 19:none with error 85
2025-11-04T14:08:28.359093+01:00 <0.5> EXAMPLE-8(id8) /boot/kernel.amd64/kernel: [drv.c:1499](pid 67605="python3.8")(tid=102284) Drive sync in progress for ldnum 21
2025-11-04T14:08:28.365281+01:00 <0.5> EXAMPLE-8(id8) /boot/kernel.amd64/kernel: [lin_mark.c:376](pid 3646="isi_job_d")(tid=101140) lin_end_mark: Ending lin mark (error ECANCELED).
2025-11-04T14:08:28.365300+01:00 <0.5> EXAMPLE-8(id8) /boot/kernel.amd64/kernel: [lin_mark.c:398](pid 3646="isi_job_d")(tid=101140) lin_end_mark: Mark already canceled. (current group: <1,2770> current mark state: LIN_COLLECT_GOOD
Resolution
Als het apparaat dat moet worden geveegd is uitgesloten, moet een nieuwe taak worden gestart.
Als een ander probleem ervoor zorgt dat het apparaat vaak niet beschikbaar is, moet dit verder worden onderzocht.