PowerScale: Collect ve MultiScan, hariç tutulan aygıtta alan kazanmıyor
Summary: Collect ve MultiScan, iş çalıştırıldığında aygıtları tarama dışında tutar.
Symptoms
Bu KB yalnızca çalışan veya tamamlanan Collect işleri ya da bu işlerde Collect çalıştırılan MultiScan işleri içindir.
Collect, kullanılamaz hale geldiğinde cihazda kalan blokları boşaltmak için kullanılır.
MultiScan, işi kontrol ederek MultiScan'in Collect işlemini çalıştırdığından emin olmak için zaman zaman hem AutoBalance'ı hem de Collect'i çalıştırır.
# isi job view <jobID#>
Collect'in işaretleme aşamasında, bloklar süpürme aşamasına girdiğinde daha sonra temizlenmek üzere işaretlenir.
Bazı durumlarda, bir cihaz, işaretleme aşamasında işin süpürme işleminin dışında tutulabilir.
Bu, iş başarıyla tamamlandıktan sonra bile kümeyi dengesiz düğümler veya sürücülerle baş başa bırakabilir.
Çok fazla sürücü veya düğüm işten dışlanırsa iş iptal edilir.
Cause
Bir aygıtın arızalanması veya kullanılamaması durumunda iş, aygıtı tarama aşamasından hariç tutar.
Bu, düğümün yeniden başlatılması, güç döngüsü, düğüm bölünmesi gibi çeşitli nedenlerden kaynaklanabilir.
Sürücülerde bu durum, sürücünün durması veya başka bir şekilde kullanılamaz hale gelmesi durumunda ortaya çıkabilir.
Collect veya MultiScan çalışırken bir aygıt kullanılamaz hale gelirse iş, aygıtı bam_nosweep Hariç tutulan cihazlar listesi.
İş tarama aşamasına girdiğinde, bam_nosweep Hariç tutulanlar listesi.
Bu, iş başarıyla tamamlandıktan sonra düğümlerin veya sürücülerin daha yüksek kapasite kullanımıyla dengesiz kalmasına neden olabilir.
Örnek 1'de, ileti günlüğünde dışlanan ve devid 28 olarak gösterilen bir devid gösterilmektedir.
2025-03-08T22:09:15.238162-08:00 <0.5> EXAMPLE-1(id25) /boot/kernel.amd64/kernel: [bam_nosweep.c:298](pid 63766="isi_job_d")(tid=104229) bam_nosweep_add_devices: Exclude set { devids (1) = [ 28 ], wdls = [] }
Örnek 2'de, devid 18'deki bir sürücünün bir zaman damgasının hariç tutulması ve ardından devid 24'teki bir sürücü gösterilmektedir.
2024-11-04T16:20:33.664254-07:00 <0.5> EXAMPLE-12(id12) /boot/kernel.amd64/kernel: [bam_nosweep.c:298](pid 83067="isi_job_d")(tid=103674) bam_nosweep_add_devices: Exclude set { devids (0) = [], wdls (1) = [ (d: 18, unm:00000040 ] }
2024-11-04T17:06:21.738071-08:00 <0.5> EXAMPLE-12(id12) /boot/kernel.amd64/kernel: [bam_nosweep.c:298](pid 83067="isi_job_d")(tid=103674) bam_nosweep_add_devices: Exclude set { devids (0) = [], wdls (2) = [ (d: 18, unm:00000040, (d: 24, unm:00000020 ] }
Cihazların %28,1'inin hariç tutulması nedeniyle hariç tutulan cihazların yüzdesi nedeniyle Tahsilat'ın iptal edilmesi örneği, sınır %25'tir.
2025-11-04T14:08:28.356984+01:00 <0.5> EXAMPLE-8(id8) /boot/kernel.amd64/kernel: [bam_mark.c:1923](pid 3646="isi_job_d")(tid=101140) Mark not permitted with 28.1% of 32 nodes excluded (limit 25.0%)
2025-11-04T14:08:28.356994+01:00 <0.5> EXAMPLE-8(id8) /boot/kernel.amd64/kernel: [bam_mark.c:1837](pid 3646="isi_job_d")(tid=101140) Updated mark for cookie 19:none with error 85
2025-11-04T14:08:28.359093+01:00 <0.5> EXAMPLE-8(id8) /boot/kernel.amd64/kernel: [drv.c:1499](pid 67605="python3.8")(tid=102284) Drive sync in progress for ldnum 21
2025-11-04T14:08:28.365281+01:00 <0.5> EXAMPLE-8(id8) /boot/kernel.amd64/kernel: [lin_mark.c:376](pid 3646="isi_job_d")(tid=101140) lin_end_mark: Ending lin mark (error ECANCELED).
2025-11-04T14:08:28.365300+01:00 <0.5> EXAMPLE-8(id8) /boot/kernel.amd64/kernel: [lin_mark.c:398](pid 3646="isi_job_d")(tid=101140) lin_end_mark: Mark already canceled. (current group: <1,2770> current mark state: LIN_COLLECT_GOOD
Resolution
Süpürülmesi gereken aygıt hariç tutulmuşsa yeni bir iş başlatılmalıdır.
Aygıtın sık sık kullanılamamasına neden olan başka bir sorun varsa sorunun daha ayrıntılı araştırılması gerekir.