PowerScale: Collect 및 MultiScan이 제외된 디바이스에서 공간을 회수하지 않음
Summary: Collect 및 MultiScan은 작업 실행 중에 사용할 수 없게 될 경우 디바이스를 스윕에서 제외합니다.
Symptoms
이 KB는 실행 중이거나 완료된 Collect 작업 또는 그 안에서 Collect를 실행한 MultiScan 작업에만 해당됩니다.
Collect는 사용할 수 없게 되었을 때 장치에 남아 있는 블록을 회수하는 데 사용됩니다.
MultiScan은 때때로 AutoBalance와 Collect를 모두 실행하여 작업을 확인하여 MultiScan이 Collect를 실행했는지 확인합니다.
# isi job view <jobID#>
Collect의 표시 단계에서는 블록이 스윕 단계로 들어가면 나중에 정리할 수 있도록 블록이 표시됩니다.
경우에 따라 표시 단계 동안 작업의 스윕 작업에서 장치가 제외될 수 있습니다.
이로 인해 작업이 성공적으로 완료된 후에도 클러스터에 불균형한 노드 또는 드라이브가 남을 수 있습니다.
작업에서 제외되는 드라이브 또는 노드가 너무 많으면 작업이 취소됩니다.
Cause
장치가 다운되거나 사용할 수 없는 경우 작업은 장치를 스윕 단계에서 제외합니다.
노드 재부팅, 전원 주기, 노드 분할 등 다양한 원인으로 인해 발생할 수 있습니다.
드라이브의 경우 드라이브가 중단되거나 사용할 수 없게 될 경우 이 문제가 발생할 수 있습니다.
Collect 또는 MultiScan을 실행하는 동안 디바이스를 사용할 수 없게 되면 작업은 디바이스를 bam_nosweep 제외된 디바이스 목록.
작업이 스윕 단계에 들어가면 에 추가되지 않은 디바이스의 모든 블록을 스윕합니다. bam_nosweep 제외 목록.
이로 인해 작업이 성공적으로 완료된 후 노드 또는 드라이브의 불균형이 유지되어 더 높은 용량 활용도로 유지될 수 있습니다.
예 1은 메시지 로그 내에서 제외된 하나의 devid를 보여줍니다(devid 28로 표시됨).
2025-03-08T22:09:15.238162-08:00 <0.5> EXAMPLE-1(id25) /boot/kernel.amd64/kernel: [bam_nosweep.c:298](pid 63766="isi_job_d")(tid=104229) bam_nosweep_add_devices: Exclude set { devids (1) = [ 28 ], wdls = [] }
예 2에서는 devid 18의 드라이브가 제외되고 그 뒤에 devid 24의 드라이브가 제외되는 것을 보여줍니다.
2024-11-04T16:20:33.664254-07:00 <0.5> EXAMPLE-12(id12) /boot/kernel.amd64/kernel: [bam_nosweep.c:298](pid 83067="isi_job_d")(tid=103674) bam_nosweep_add_devices: Exclude set { devids (0) = [], wdls (1) = [ (d: 18, unm:00000040 ] }
2024-11-04T17:06:21.738071-08:00 <0.5> EXAMPLE-12(id12) /boot/kernel.amd64/kernel: [bam_nosweep.c:298](pid 83067="isi_job_d")(tid=103674) bam_nosweep_add_devices: Exclude set { devids (0) = [], wdls (2) = [ (d: 18, unm:00000040, (d: 24, unm:00000020 ] }
제외된 디바이스의 비율로 인해 Collect가 취소되는 예: 제외되는 디바이스의 28.1%로 제한은 25%입니다.
2025-11-04T14:08:28.356984+01:00 <0.5> EXAMPLE-8(id8) /boot/kernel.amd64/kernel: [bam_mark.c:1923](pid 3646="isi_job_d")(tid=101140) Mark not permitted with 28.1% of 32 nodes excluded (limit 25.0%)
2025-11-04T14:08:28.356994+01:00 <0.5> EXAMPLE-8(id8) /boot/kernel.amd64/kernel: [bam_mark.c:1837](pid 3646="isi_job_d")(tid=101140) Updated mark for cookie 19:none with error 85
2025-11-04T14:08:28.359093+01:00 <0.5> EXAMPLE-8(id8) /boot/kernel.amd64/kernel: [drv.c:1499](pid 67605="python3.8")(tid=102284) Drive sync in progress for ldnum 21
2025-11-04T14:08:28.365281+01:00 <0.5> EXAMPLE-8(id8) /boot/kernel.amd64/kernel: [lin_mark.c:376](pid 3646="isi_job_d")(tid=101140) lin_end_mark: Ending lin mark (error ECANCELED).
2025-11-04T14:08:28.365300+01:00 <0.5> EXAMPLE-8(id8) /boot/kernel.amd64/kernel: [lin_mark.c:398](pid 3646="isi_job_d")(tid=101140) lin_end_mark: Mark already canceled. (current group: <1,2770> current mark state: LIN_COLLECT_GOOD
Resolution
스윕이 필요한 장치가 제외된 경우 새 작업을 시작해야 합니다.
다른 문제로 인해 디바이스를 자주 사용할 수 없게 되는 경우에는 추가로 조사해야 합니다.