PowerScale: PowerScale 클러스터에서 점보 프레임이 활성화된 경우 SyncIQ 복제 문제

Summary: SyncIQ 작업자 재시작 및 네트워크 관련 오류로 인해 SyncIQ 복제 작업이 간헐적으로 실패할 수 있습니다. 이러한 문제는 PowerScale 서브넷이 점보 프레임을 사용하도록 구성된 환경에서 자주 관찰됩니다. KB(Knowledge Base)는 IP 헤더에 설정된 "Do Not Fragment"(DF) 플래그를 사용하여 IP 패킷을 전송할 때 엔드 투 엔드 네트워크 인프라가 점보 프레임을 지원하는지 여부를 확인하는 절차를 간략하게 설명합니다. DF 비트가 활성화되면 중간 디바이스는 크기가 큰 패킷을 프래그먼트화할 수 없습니다. 네트워크 경로의 세그먼트가 구성된 MTU 크기(일반적으로 점보 프레임의 경우 9000바이트)를 지원하지 않는 경우 이러한 패킷이 삭제되어 SyncIQ 작업자 프로세스가 실패하고 복제 작업이 불안정해질 수 있습니다. ...

This article applies to This article does not apply to This article is not tied to any specific product. Not all product versions are identified in this article.

Symptoms

다음 오류와 함께 SyncIQ 복제가 실패할 수 있습니다. "SyncIQ policy failed. A work item has been restarted too many times." 

 

  • 소규모 데이터 세트를 복제하는 SyncIQ 작업은 일반적으로 성공적으로 완료됩니다.
  • 대용량 데이터 세트가 포함된 SyncIQ 작업은 실행 중에 실패할 수 있습니다.
  • 암호화를 사용하지 않는 SyncIQ 복제 작업은 성공하지만 암호화를 사용하는 복제 작업은 즉시 실패합니다.

Cause

이 문제는 동적 라우팅이 활성화된 환경에서 간헐적으로 발생하거나 임의로 나타날 수 있습니다. 이러한 경우 SyncIQ 트래픽이 패킷 조각화를 지원하지 않는 네트워크 경로를 통해 라우팅되어 장애가 발생할 수 있습니다.



문제 해결:
 

  1. ping 명령을 사용하여 종단 간 MTU 호환성을 테스트하여 네트워크 인프라스트럭처가 점보 프레임을 지원하는지 확인합니다. 
     
다음으로 ping 소스 클러스터의 복제 인터페이스에서 타겟 클러스터의 복제 인터페이스로 명령을 실행하여 DF(Do Not Fragment') 플래그를 설정하지 않고 페이로드 크기를 8972바이트로 지정합니다.
   
        isi_for_array -n<lnn> 'ping -S <source-ip> -s 8972 <target-ip>'
source-1# isi_for_array -n1 'ping -c 4 -S xxx.xxx.xxx.xxx -s 8972 yyy.yyy.yyy.yyy'     
source-1: PING yyy.yyy.yyy.yyy (10.0.1.231) from xxx.xxx.xxx.xxx: 8972 data bytes
source-1: 1528 bytes from yyy.yyy.yyy.yyy: icmp_seq=0 ttl=64 time=0.944 ms
source-1: 1528 bytes from yyy.yyy.yyy.yyy: icmp_seq=1 ttl=64 time=0.797 ms
source-1: 1528 bytes from yyy.yyy.yyy.yyy: icmp_seq=2 ttl=64 time=0.912 ms

            출력은"DF(Do Not Fragment)" 플래그가 설정되지 않은 경우 네트워크가 패킷을 성공적으로 전달했음을 보여주며, 이는 패킷이 전송 중에 프래그먼트화될 수 있음을 시사합니다. 
   

 "Do Not Fragment" 플래그가 활성화된 상태에서 소스 클러스터의 복제 인터페이스에서 타겟 클러스터의 복제 인터페이스로 ping을 전송하여 점보 패킷 지원을 확인하려면 다음 단계를 따르십시오. 
   
          isi_for_array -n<lnn> 'ping -S <source-ip> -D -s 8972 <target-ip>'  

source-1# isi_for_array -n1 'ping -c 4 -S xxx.xxx.xxx.xxx -D -s 8972 yyy.yyy.yyy.yyy'                                                 
source-1: ping: sendto: Message too long
source-1: ping: sendto: Message too long
source-1: ping: sendto: Message too long
source-1: ping: sendto: Message too long
source-1: ping: sendto: Message too long

            출력은 "Do Not Fragment"(DF) 비트가 설정될 때 패킷 전송이 실패하는 것을 보여주며, 이는 가능한 MTU 제약 조건 또는 경로 MTU 검색에 대한 문제를 시사합니다. 

 

참고: Ping 테스트는 모든 네트워크 경로와 SyncIQ 복제에 관여하는 모든 소스 및 타겟 클러스터 인터페이스에서 수행해야 합니다.

 

  1. 이전(예전) 메시지로 이동과 traceroute 점보 프레임을 지원하지 않을 수 있는 중간 네트워크 홉을 식별하기 위한 MTU 테스트를 사용합니다. 

    "DF(Do Not Fragment)" 플래그가 설정되지 않은 상태에서 페이로드 크기를 8972바이트로 지정하여 테스트합니다.

              isi_for_array -n<lnn> 'traceroute -s <source-ip> -p 5667 <target-ip> 8972'
source-1# isi_for_array -n1 'traceroute -s xxx.xxx.xxx.xxx -p 5667 yyy.yyy.yyy.yyy 8972'                                              
traceroute to yyy.yyy.yyy.yyy (yyy.yyy.yyy.yyy) from xxx.xxx.xxx.xxx, 64 hops max, 8972 byte packets
 1  example.name.internal (aaa.aaa.aaa.aaa)  0.577 ms  0.470 ms  0.472 ms
 2  bbb.bbb.bbb.bbb (bbb.bbb.bbb.bbb)  24.810 ms
    ccc.ccc.ccc.ccc (ccc.ccc.ccc.ccc)  23.418 ms  23.366 ms
 3  yyy.yyy.yyy.yyy (yyy.yyy.yyy.yyy)  23.639 ms  23.596 ms  23.608 ms

            출력은 'DF(Do Not Fragment') 플래그가 설정되지 않았을 때 traceroute 테스트가 성공적으로 완료되었음을 보여줍니다.

source-1# isi_for_array -n1 'traceroute -s xxx.xxx.xxx.xxx -p 5667 yyy.yyy.yyy.yyy 8972'
traceroute to yyy.yyy.yyy.yyy (yyy.yyy.yyy.yyy) from xxx.xxx.xxx.xxx, 64 hops max, 8972 byte packets
 1  * * *
 2  * * *
 3  yyy.yyy.yyy.yyy (yyy.yyy.yyy.yyy)  23.661 ms  23.618 ms  23.743 ms

            출력은 'DF'(Do Not Fragment') 플래그가 설정되지 않았을 때 traceroute 테스트가 성공적으로 완료되었지만 네트워크 경로를 따라 단편화 표시기가 관찰되었음을 보여줍니다
 

"Do Not Fragment"(DF) 플래그가 설정된 상태에서 페이로드 크기를 8972바이트로 지정하여 테스트합니다.

     isi_for_array -n<lnn> 'traceroute -F -s <source-ip> -p 5667 <target-ip> 8972'

source-1# isi_for_array -n1 'traceroute -F -s xxx.xxx.xxx.xxx -p 5667 yyy.yyy.yyy.yyy 8972'
traceroute to yyy.yyy.yyy.yyy (yyy.yyy.yyy.yyy) from xxx.xxx.xxx.xxx, 64 hops max, 8972 byte packets
traceroute: sendto: Message too long
 1 traceroute: wrote yyy.yyy.yyy.yyy 8972 chars, ret=-1
 *traceroute: sendto: Message too long
traceroute: wrote yyy.yyy.yyy.yyy 8972 chars, ret=-1
 *traceroute: sendto: Message too long
traceroute: wrote yyy.yyy.yyy.yyy 8972 chars, ret=-1
 *
traceroute: sendto: Message too long
 2 traceroute: wrote yyy.yyy.yyy.yyy 8972 chars, ret=-1
 *traceroute: sendto: Message too long
traceroute: wrote yyy.yyy.yyy.yyy 8972 chars, ret=-1
 *traceroute: sendto: Message too long
traceroute: wrote yyy.yyy.yyy.yyy 8972 chars, ret=-1
 * 

           출력은 타겟에 대한 traceroute가 실패했음을 나타내며, 이는 네트워크 경로를 따라 잠재적인 MTU 제한 또는 단편화 문제를 시사합니다.                     

Resolution

해결 방법:

  1. SyncIQ 트래픽에 지정된 PowerScale 서브넷이 9000바이트의 MTU로 구성된 경우 참여하는 PowerScale 클러스터 간의 전체 네트워크 경로가 점보 프레임을 완전히 지원하도록 하는 것이 중요합니다.
  2. 참여하는 PowerScale 클러스터 간의 네트워크 경로가 점보 프레임을 지원하지 않는 경우 소스 시스템과 타겟 시스템 모두에서 SyncIQ 트래픽 전용 PowerScale 서브넷이 1500바이트의 MTU로 구성되어 있는지 확인합니다.

 

참고: MTU 설정을 조정하면 진행 중인 데이터 흐름이 중단될 수 있으며 SyncIQ 복제 또는 NFS 작업과 같이 일관된 패킷 전달에 의존하는 서비스에 영향을 줄 수 있습니다. 유지 보수 기간 중에 이러한 변경을 수행하는 것이 좋습니다. 변경 사항을 적용하기 전에 모든 네트워크 세그먼트에서 적절한 조정 및 검증을 보장합니다.

Affected Products

Isilon

Products

Isilon, Isilon SyncIQ
Article Properties
Article Number: 000056217
Article Type: Solution
Last Modified: 27 Nov 2025
Version:  6
Find answers to your questions from other Dell users
Support Services
Check if your device is covered by Support Services.