Connectrix: 제거를 통해 포트 또는 SFP 통신 문제를 전환하도록 Fibre Channel 노드 문제를 해결하는 방법, 자체 도움말

Summary: 이 문서에서는 제거를 통해 Fibre Channel 노드-스위치 포트 또는 SFP 통신 문제를 해결하는 방법에 대해 설명합니다.

This article applies to This article does not apply to This article is not tied to any specific product. Not all product versions are identified in this article.

Symptoms

제거를 통해 Fibre Channel 노드-스위치 포트 또는 SFP 통신 문제를 해결하는 방법은 무엇입니까?

너무 많은 사전 예방적 SFP 교체
링크 장애
G 포트
표시등 없음
NOS(Not Operational Sequence)
OLS(Off Line Sequence)
신호 손실
SFP 결함
FC 포트 문제 해결
FC 포트의 오류

Cause

SFP 또는 스위치 외부에 문제가 있는데 너무 많은 SFP가 사전 예방적으로 교체되었습니다.

Resolution

이 문제를 해결하려면 다음 단계를 수행하십시오.

  1. 통신 장애와 관련된 노드 및 스위치 포트를 식별합니다.
  2. 스위치 포트가 관리상 작동 중(차단 해제, 종료 안 함)이거나 활성화되어 있는지 확인합니다.
  3. 계속하기 전에 연결된 디바이스에 사용할 수 있는 이중화 경로가 있는지 확인합니다.

 

경고: 계속 진행하기 전에 노드가 새 FCID를 가져오는 경우 어떻게 반응하는지 알아야 합니다. AIX 및 HP-UX의 일부 운영 체제 버전은 FCID가 스토리지 디바이스에 대한 하드웨어 경로에 기본 제공되므로 이러한 변화에 제대로 반응하지 않습니다. 케이블을 이동하면 데이터를 사용하지 못하게 될 수 있습니다. 궁금한 점이 있으면 EMC 기술 지원 엔지니어에게 문의하십시오.

 

  1. 문제가 되는 SFP를 제거하려면 다음을 수행합니다.
참고:  SFP에 문제가 있는 경우 이 절차가 디바이스를 다시 온라인으로 전환하는 가장 빠른 방법입니다.

 

  1. 스위치에 여유 포트가 있는지 확인합니다.
  2. 스위치에서 식별된 여유 포트를 비활성화합니다.
  3. 조사할 포트에서 이전 단계에서 비활성화된 새 여유 포트로 케이블을 이동합니다.
  4. 비활성화된 포트를 활성화 상태(또는 관리상 작동 중)로 변경하고 디바이스를 다시 온라인으로 전환합니다.
  5. 스위치에서 통계/카운터를 지우거나 0으로 재설정합니다.

Brocade의 경우 다음 KBA를 참조하십시오. 

Connectrix B-Series Brocade: Connectrix Brocade B-Series 스위치 및 디렉터에서 인터페이스 및 ASIC 카운터를 지우는 방법 

Cisco의 경우 다음 KBA를 참조하십시오. 

Connectrix - MDS Series Cisco: MDS에서 인터페이스 및 ASIC 카운터를 지우는 방법

 

  1. 4-6시간 동안 해당 명령을 사용하여 포트를 모니터링합니다.

 

결과:

  • 오류 카운터가 증가하는 경우 문제가 스위치 외부에 있는 것이며 고객/사용자/SAN 관리자에게 다음과 같이 조언해야 합니다.

 

    • 새 포트 SFP 및 케이블을 청소해야 합니다. (불결한 케이블의 SFP 오염을 방지하려면 전문 청소 키트를 사용하는 것이 좋습니다.)
    • 연결된 디바이스는 해당 디바이스를 지원하는 사람이 추가로 조사해야 합니다.
    • Cisco 스위치에서 카운터 증가 없이 "errdisabled" 상태가 다시 발생하면 추가 백엔드 조사를 위해 SR을 열어야 합니다.

 

  • 오류가 증가하지 않거나 Cisco 스위치의 Errdisabled 상태가 다시 발생하지 않는 경우 이전 포트의 SFP에 결함이 있는 것입니다. SFP 교체를 위해 SR을 제출하며 로그 출력, SFP 세부 정보(SM 또는 MM, 속도 등)를 포함하여 위의 분석 결과를 제공합니다.

 

참고: 케이블 및/또는 연결된 디바이스를 교체한 경우 카운터를 확인하여 6단계부터 동일한 절차를 수행할 수 있습니다.

 

Additional Information

참고: 대부분의 경우 SFP 옵티컬 트랜시버에 확실히 장애가 발생하면 이벤트 로그에 명확한 옵틱 장애가 표시됩니다.


하드웨어 오류는 문제에 간단한 알고리듬을 적용하여 쉽게 격리할 수 있습니다. 해당 하드웨어에 오류가 없으면 다른 하드웨어에 오류가 있는 것입니다. 문제가 있는 하드웨어를 가리키는 오류가 격리될 때까지 반복합니다.


Brocade 예:

참고: porterrshow의 카운터에 대한 해명이나 설명은 자체 도움말 KBA(Knowledge Base Article)를 참조하십시오. (아래에 강조된 예)
Connectrix B-Series: Brocade porterrshow 출력을 해석하는 방법 및 카운터의 의미 자체 도움말



예 1           ENC OUT과 LINK FAIL 및 LOSS SYNC:

 

porterrshow        :
CURRENT CONTEXT -- 3 , 111
     frames        enc  crc  crc    too   too   bad  enc   disc  link  loss  loss  frjt  fbsy  c3timeout    pcs
     tx     rx     in   err  g_eof  shrt  long  eof  out   c3    fail  sync  sig               tx    rx     err
xx:  849.1k 493.2k 0    0    0      0     0     0    2.3m  0     4     6     0     0     0     0      0     0


일반적인 이유:
포트 통계가 지난 24시간 이내에 삭제된 경우에만 유효합니다. 그렇지 않으면 이러한 카운터를 기간별로 분류합니다. (위의 9번 항목과 같이) 포트 통계를 지우고, 카운터를 확인하고, 4~6시간 후에 데이터를 다시 가져옵니다.

오류에서 link fail, loss sync 및 enc out 오류를 볼 수 있으며, 여기에는 loss sig 오류도 포함될 수 있습니다.
이러한 오류 조합은 일반적으로 호스트 재부팅 또는 스위치 외부의 링크 재설정을 나타냅니다. enc out 오류는 링크 초기화의 일부로 속도 협상 중에 발생합니다.

예상 조치:
포트에 연결된 디바이스가 오프라인 및/또는 온라인으로 전환해야 하는 정당한 이유가 있는지 확인합니다. 호스트 재부팅을 예로 들 수 있습니다. 그렇지 않은 경우 SR을 제출하십시오.


예 2           ENC OUT:

porterrshow        :
CURRENT CONTEXT -- 3 , 111
     frames        enc  crc  crc    too   too   bad  enc   disc  link  loss  loss  frjt  fbsy  c3timeout    pcs
     tx     rx     in   err  g_eof  shrt  long  eof  out   c3    fail  sync  sig               tx    rx     err
xx:  849.1k 493.2k 0    0    0      0     0     0    2.3m  0     0     0     0     0     0     0      0     0


일반적인 이유:
포트 통계가 지난 24시간 이내에 삭제된 경우에만 유효합니다. 그렇지 않으면 이러한 카운터를 기간별로 분류합니다. (위의 9번 항목과 같이) 포트 통계를 지우고, 카운터를 확인하고, 4~6시간 후에 데이터를 다시 가져옵니다.

관련 오류가 없는 enc out 오류는 케이블이 더러워졌음을 나타냅니다.

예상 조치:
이 포트 및 연결된 디바이스에 연결된 케이블 및 SFP의 모든 광학면을 검사하고 청소합니다.


예 3     CRC 및 CRC G_EOF:

porterrshow        :
CURRENT CONTEXT -- 3 , 111
     frames        enc  crc  crc    too   too   bad  enc   disc  link  loss  loss  frjt  fbsy  c3timeout    pcs
     tx     rx     in   err  g_eof  shrt  long  eof  out   c3    fail  sync  sig               tx    rx     err
xx:  849.1k 493.2k 0    1.2k 1.2k   0     0     0    0     0     0     0     0     0     0     0      0     0


일반적인 이유:
포트 통계가 지난 24시간 이내에 삭제된 경우에만 유효합니다. 그렇지 않으면 이러한 카운터를 기간별로 분류합니다. (위의 9번 항목과 같이) 포트 통계를 지우고, 카운터를 확인하고, 4~6시간 후에 데이터를 다시 가져옵니다.

프레임이 불량 CRC가 있는 스위치 포트로 들어가고 있지만 프레임 끝은 여전히 양호로 표시됩니다.
이는 불량 프레임을 등록하는 첫 번째 포트임을 나타내므로 문제는 이 특정 포트의 SFP/케이블/연결된 디바이스 인터페이스인 것입니다.

예상 조치:
해결 방법의 기본 작업을 참조하십시오.

ISL 포트의 경우 (위의 9번 항목과 같이) 통계를 지우고, 카운터를 확인하고, 4~6시간 후에 데이터를 다시 가져오고, 두 스위치 모두에서 supportsave를 수집하고 SR을 열어 일반적인 문제 해결을 진행합니다.

 

예 4     CRC:

porterrshow        :
CURRENT CONTEXT -- 3 , 111
     frames        enc  crc  crc    too   too   bad  enc   disc  link  loss  loss  frjt  fbsy  c3timeout    pcs
     tx     rx     in   err  g_eof  shrt  long  eof  out   c3    fail  sync  sig               tx    rx     err
xx:  849.1k 493.2k 0    1.2k 0      0     0     0    0     0     0     0     0     0     0     0      0     0


일반적인 이유:
포트 통계가 지난 24시간 이내에 삭제된 경우에만 유효합니다. 그렇지 않으면 이러한 카운터를 기간별로 분류합니다. (위의 9번 항목과 같이) 포트 통계를 지우고, 카운터를 확인하고, 4~6시간 후에 데이터를 다시 가져옵니다.

포트가 불량 CRC 프레임과 함께 스위치에 들어가는 프레임을 기록하고 있지만 해당 프레임은 이미 불량으로 표시되어 있습니다. 일반적으로 ISL 및 NPIV F 포트에서 볼 수 있습니다.

예상 조치:
CRC 오류가 NPIV 포트에 로깅되면 유지 보수 공급업체에 디바이스 조사를 맡기십시오!
ISL 포트의 경우 패브릭의 모든 포트에서 crc g_oef 포트 로깅을 확인하고 예 3과 같은 조치를 취합니다.


예 5     PCS ERR과 LINK FAIL 및 LOSS SYNC:

porterrshow        :
CURRENT CONTEXT -- 3 , 111
     frames        enc  crc  crc    too   too   bad  enc   disc  link  loss  loss  frjt  fbsy  c3timeout    pcs
     tx     rx     in   err  g_eof  shrt  long  eof  out   c3    fail  sync  sig               tx    rx     err
xx:  849.1k 493.2k 0    0    0      0     0     0    0     0     4     4     0     0     0     0      0     466


일반적인 이유:
포트 통계가 지난 24시간 이내에 삭제된 경우에만 유효합니다. 그렇지 않으면 이러한 카운터를 기간별로 분류합니다. (위의 9번 항목과 같이) 포트 통계를 지우고, 카운터를 확인하고, 4~6시간 후에 데이터를 다시 가져옵니다.

이는 10Gbps 또는 16Gbps 이상 포트(6505/6510/6520/DCX-8510)를 지원하는 플랫폼에만 적용되며, GEN5 플랫폼인 Condor3 ASIC과 함께 도입되었습니다.

ER_PCS_BLK는 PCS(Physical Coding Sublayer) 블록 오류의 수를 표시합니다. 이 카운터는 8Gb/4Gb 링크에 대한 enc_out과 동일하며 10GB 및 16GB 이상 속도에만 사용됩니다.
오류에서 link fail, loss sync 및 pcs err 오류를 볼 수 있으며, 여기에는 loss sig 오류도 포함될 수 있습니다.
이러한 오류 조합은 일반적으로 호스트 재부팅 또는 스위치 외부의 링크 재설정을 나타냅니다.
pcs err 오류는 링크 초기화의 일부로 속도 협상 중에 발생합니다.

예상 조치:
포트에 연결된 디바이스가 오프라인 및/또는 온라인으로 전환해야 하는 정당한 이유가 있는지 확인합니다. 호스트 재부팅을 예로 들 수 있습니다. 그렇지 않은 경우 SR을 제출하십시오.


예 6     PCS ERR:

porterrshow        :
CURRENT CONTEXT -- 3 , 111
     frames        enc  crc  crc    too   too   bad  enc   disc  link  loss  loss  frjt  fbsy  c3timeout    pcs
     tx     rx     in   err  g_eof  shrt  long  eof  out   c3    fail  sync  sig               tx    rx     err
xx:  849.1k 493.2k 0    0    0      0     0     0    0     0     0     0     0     0     0     0      0     466


일반적인 이유:
포트 통계가 지난 24시간 이내에 삭제된 경우에만 유효합니다. 그렇지 않으면 이러한 카운터를 기간별로 분류합니다. (위의 9번 항목과 같이) 포트 통계를 지우고, 카운터를 확인하고, 4~6시간 후에 데이터를 다시 가져옵니다.

관련 오류가 없는 PCS ERR 오류는 케이블이 더러워졌음을 나타냅니다.

예상 조치:
이 포트 및 연결된 디바이스에 연결된 케이블 및 SFP의 모든 광학면을 검사하고 청소합니다.

 


CISCO 예:

예 1    Errdisabled:

Errdisabled - 인터페이스 오류 증가 없음
 

fc1/1 is down (Error disabled - bit error rate too high)
    Hardware is Fibre Channel, SFP is short wave laser w/o OFC (SN).
    5 minutes input rate 0 bits/sec, 0 bytes/sec, 0 frames/sec
    5 minutes output rate 0 bits/sec, 0 bytes/sec, 0 frames/sec
      179 frames input, 7668 bytes
        0 discards, 0 errors
        0 CRC,  0 unknown class
        0 too long, 0 too short
      23 frames output, 1320 bytes
        0 discards, 0 errors
      1 input OLS, 1 LRR, 0 NOS, 1 loop inits
      2 output OLS, 0 LRR, 0 NOS, 1 loop inits
    Interface last changed at Thu Jun  5 01:51:00 2014

 

일반적인 이유:
인터페이스의 "Errdisabled" 상태는 인터페이스 카운터가 프런트엔드에서는 깨끗할 수 있고 스위치가 "errdisabled" 상태의 포트를 다운시키는 것처럼 보이며 백엔드(ASIC/내부/라인 카드)에서 오류 카운터가 증가하기 때문에 다소 오해의 소지가 있을 수 있습니다.

예상 조치:
해결 방법의 기본 작업을 참조하십시오. 다시 발생하는 경우 기술 지원 세부 정보 출력을 수집하고 SR을 엽니다.
 

참고: Cisco의 "Errdisabled" 상태에 대한 정보: 비트 오류는 다음과 같은 이유로 발생할 수 있습니다.
  • 결함이 있거나 불량한 케이블
  • SFP 결함 또는 불량
  • SFP가 1Gbps에서 작동하도록 지정되었지만 2Gbps에서 사용됨
  • SFP가 2Gbps에서 작동하도록 지정되었지만 4Gbps에서 사용됨
  • 단거리 케이블이 장거리에 사용되거나 장거리 케이블이 단거리에 사용됨
  • 일시적인 동기화 손실
  • 한쪽 또는 양쪽 끝의 케이블 연결이 느슨함
  • 한쪽 또는 양쪽 끝에서 SFP 연결이 잘못됨


5분 동안 15개의 오류 버스트가 발생하면 비트 오류율 임계값이 감지됩니다. 기본적으로 스위치는 임계값에 도달하면 인터페이스를 비활성화합니다. 아래 명령을 순서대로 입력하여 인터페이스를 다시 활성화할 수 있습니다.

shutdown
no shutdown
임계값을 초과할 때 인터페이스를 비활성화하지 않도록 스위치를 구성할 수 있습니다.


기본적으로 임계값은 인터페이스를 비활성화합니다.


예 2:   CRC

CRC 증가
 

fc13/1 is down (Initializing)
    Port description is ***
    Hardware is Fibre Channel, SFP is long wave laser cost reduced.
    5 minutes input rate 32 bits/sec, 4 bytes/sec, 0 frames/sec
    5 minutes output rate 32 bits/sec, 4 bytes/sec, 0 frames/sec
      162 frames input, 6136 bytes
        0 discards, 17 errors
        17 CRC,  0 unknown class
        0 too long, 17 too short
      74 frames output, 6304 bytes
        2 discards, 0 errors
      108 input OLS, 54 LRR, 2 NOS, 0 loop inits
      83 output OLS, 26 LRR, 56 NOS, 0 loop inits
    Interface last changed at Tue May 27 08:37:20 2014


일반적인 이유:

포트가 불량 CRC가 있는 스위치로 들어가는 프레임을 기록하고 있지만 프레임 끝은 양호합니다. CRC 카운터는 오류를 로깅하는 특정 수신 포트에서만 증가하며 이 물리적 링크에서 모든 조사를 수행해야 합니다.

예상 조치:
해결 방법의 기본 작업을 참조하십시오.

(위의 9번 항목과 같이) 포트 통계를 지우고, 카운터를 확인하고, 4~6시간 후에 데이터를 다시 가져옵니다.

 

예 3: NOS

NOS(Non-Operational Sequence)

show int fc1/1 counters
fc1/1
    5 minutes input rate 1753296 bits/sec, 219162 bytes/sec, 199 frames/sec
    5 minutes output rate 2310384 bits/sec, 288798 bytes/sec, 194 frames/sec
    2741512190 frames input, 2542476084276 bytes
      0 class-2 frames, 0 bytes
      2741512190 class-3 frames, 2542476084276 bytes
      0 class-f frames, 0 bytes
      0 discards, 0 errors, 0 CRC
      0 unknown class, 0 too long, 0 too short
    3410405365 frames output, 5164364339412 bytes
      0 class-2 frames, 0 bytes
      3410405365 class-3 frames, 5164364339412 bytes
      0 class-f frames, 0 bytes
      0 discards, 0 errors
    1 input OLS, 1 LRR, 0 NOS, 307 loop inits
    289 output OLS, 289 LRR, 289 NOS, 289 loop inits
    0 link failures, 0 sync losses, 0 signal losses
     48276 BB credit transitions from zero
      16 receive B2B credit remaining
      3 transmit B2B credit remaining
      3 low priority transmit B2B credit remaining

 

일반적인 이유:

링크 협상 전에 연결이 끊어졌습니다.


예상 조치:
계층 1(물리적 계층)과 소스 디바이스를 확인합니다.

Affected Products

Connectrix

Products

Connectrix, Connectrix B-Series Hardware, Connectrix MDS-Series Hardware
Article Properties
Article Number: 000028863
Article Type: Solution
Last Modified: 29 Jul 2025
Version:  9
Find answers to your questions from other Dell users
Support Services
Check if your device is covered by Support Services.