PowerScale: Collect and MultiScan non recupera spazio sul dispositivo escluso

Summary: Collect and MultiScan esclude i dispositivi dalla scansione se non sono disponibili durante l'esecuzione del lavoro.

This article applies to This article does not apply to This article is not tied to any specific product. Not all product versions are identified in this article.

Symptoms

Questo articolo della KB riguarda solo i processi Collect in esecuzione o completati o i processi MultiScan che hanno eseguito Collect al loro interno. 

La raccolta viene utilizzata per liberare i blocchi lasciati su un dispositivo quando è diventato non disponibile.
A volte MultiScan esegue sia AutoBalance che Collect, per assicurarsi che MultiScan abbia eseguito Collect controllando il lavoro. 

# isi job view <jobID#>


Durante la fase di contrassegno di raccolta, i blocchi vengono contrassegnati per la successiva pulizia una volta entrati nella fase di scansione. 

In alcune situazioni, un dispositivo può essere escluso dall'operazione di scansione del lavoro durante la fase di marcatura. 
Ciò può lasciare il cluster con nodi o unità sbilanciati anche dopo che il processo è stato completato correttamente. 

Il processo viene annullato se troppe unità o nodi vengono esclusi dal processo. 

 

Cause

Nel caso in cui un dispositivo sia inattivo o non disponibile, il processo esclude il dispositivo dalla fase di scansione. 
Le cause possono essere diverse, ad esempio il riavvio di un nodo, un ciclo di alimentazione, una divisione del nodo.
Questa situazione può verificarsi con le unità, se un'unità si blocca o non è più disponibile. 

Se un dispositivo non è disponibile durante l'esecuzione di Collect o MultiScan, il processo lo imposta su bam_nosweep Elenco dei dispositivi esclusi.
Quando il lavoro entra nella fase di scansione, esegue la scansione di tutti i blocchi sui dispositivi NON aggiunti a bam_nosweep Elenco esclusi. 
Ciò può causare lo sbilanciamento dei nodi o delle unità con un utilizzo della capacità più elevato dopo che il processo è stato completato correttamente. 


L'esempio 1 mostra un devid escluso all'interno del registro dei messaggi, mostrato come devid 28.

2025-03-08T22:09:15.238162-08:00 <0.5> EXAMPLE-1(id25) /boot/kernel.amd64/kernel: [bam_nosweep.c:298](pid 63766="isi_job_d")(tid=104229) bam_nosweep_add_devices: Exclude set { devids (1) = [ 28 ], wdls = [] }


L'esempio 2 mostra un timestamp di un'unità in devid 18 esclusa, seguita da un'unità in devid 24.

2024-11-04T16:20:33.664254-07:00 <0.5> EXAMPLE-12(id12) /boot/kernel.amd64/kernel: [bam_nosweep.c:298](pid 83067="isi_job_d")(tid=103674) bam_nosweep_add_devices: Exclude set { devids (0) = [], wdls (1) = [ (d: 18, unm:00000040 ] }
2024-11-04T17:06:21.738071-08:00 <0.5> EXAMPLE-12(id12) /boot/kernel.amd64/kernel: [bam_nosweep.c:298](pid 83067="isi_job_d")(tid=103674) bam_nosweep_add_devices: Exclude set { devids (0) = [], wdls (2) = [ (d: 18, unm:00000040, (d: 24, unm:00000020 ] }


Esempio di raccolta annullata a causa della percentuale di dispositivi esclusi poiché il 28,1% dei dispositivi esclusi è il limite del 25%.

2025-11-04T14:08:28.356984+01:00 <0.5> EXAMPLE-8(id8) /boot/kernel.amd64/kernel: [bam_mark.c:1923](pid 3646="isi_job_d")(tid=101140) Mark not permitted with 28.1% of 32 nodes excluded (limit 25.0%)
2025-11-04T14:08:28.356994+01:00 <0.5> EXAMPLE-8(id8) /boot/kernel.amd64/kernel: [bam_mark.c:1837](pid 3646="isi_job_d")(tid=101140) Updated mark for cookie 19:none with error 85
2025-11-04T14:08:28.359093+01:00 <0.5> EXAMPLE-8(id8) /boot/kernel.amd64/kernel: [drv.c:1499](pid 67605="python3.8")(tid=102284) Drive sync in progress for ldnum 21
2025-11-04T14:08:28.365281+01:00 <0.5> EXAMPLE-8(id8) /boot/kernel.amd64/kernel: [lin_mark.c:376](pid 3646="isi_job_d")(tid=101140) lin_end_mark: Ending lin mark (error ECANCELED).
2025-11-04T14:08:28.365300+01:00 <0.5> EXAMPLE-8(id8) /boot/kernel.amd64/kernel: [lin_mark.c:398](pid 3646="isi_job_d")(tid=101140) lin_end_mark: Mark already canceled. (current group: <1,2770> current mark state: LIN_COLLECT_GOOD

Resolution

Se il dispositivo che necessita di sweep è stato escluso, è necessario avviare un nuovo processo.
Se un altro problema causa frequentemente l'indisponibilità del dispositivo, è necessario analizzarlo ulteriormente. 

Affected Products

Isilon, PowerScale, PowerScale OneFS
Article Properties
Article Number: 000308579
Article Type: Solution
Last Modified: 27 Nov 2025
Version:  3
Find answers to your questions from other Dell users
Support Services
Check if your device is covered by Support Services.