Connectrix: 제거를 통해 포트 또는 SFP 통신 문제를 전환하도록 Fibre Channel 노드 문제를 해결하는 방법, 자체 도움말
Summary: 이 문서에서는 제거를 통해 Fibre Channel 노드-스위치 포트 또는 SFP 통신 문제를 해결하는 방법에 대해 설명합니다.
Symptoms
제거를 통해 Fibre Channel 노드-스위치 포트 또는 SFP 통신 문제를 해결하는 방법은 무엇입니까?
너무 많은 사전 예방적 SFP 교체
링크 장애
G 포트
표시등 없음
NOS(Not Operational Sequence)
OLS(Off Line Sequence)
신호 손실
SFP 결함
FC 포트 문제 해결
FC 포트의 오류
Cause
SFP 또는 스위치 외부에 문제가 있는데 너무 많은 SFP가 사전 예방적으로 교체되었습니다.
Resolution
이 문제를 해결하려면 다음 단계를 수행하십시오.
- 통신 장애와 관련된 노드 및 스위치 포트를 식별합니다.
- 스위치 포트가 관리상 작동 중(차단 해제, 종료 안 함)이거나 활성화되어 있는지 확인합니다.
- 계속하기 전에 연결된 디바이스에 사용할 수 있는 이중화 경로가 있는지 확인합니다.
- 문제가 되는 SFP를 제거하려면 다음을 수행합니다.
- 스위치에 여유 포트가 있는지 확인합니다.
- 스위치에서 식별된 여유 포트를 비활성화합니다.
- 조사할 포트에서 이전 단계에서 비활성화된 새 여유 포트로 케이블을 이동합니다.
- 비활성화된 포트를 활성화 상태(또는 관리상 작동 중)로 변경하고 디바이스를 다시 온라인으로 전환합니다.
- 스위치에서 통계/카운터를 지우거나 0으로 재설정합니다.
Brocade의 경우 다음 KBA를 참조하십시오.
Connectrix B-Series Brocade: Connectrix Brocade B-Series 스위치 및 디렉터에서 인터페이스 및 ASIC 카운터를 지우는 방법
Cisco의 경우 다음 KBA를 참조하십시오.
Connectrix - MDS Series Cisco: MDS에서 인터페이스 및 ASIC 카운터를 지우는 방법
- 4-6시간 동안 해당 명령을 사용하여 포트를 모니터링합니다.
결과:
- 오류 카운터가 증가하는 경우 문제가 스위치 외부에 있는 것이며 고객/사용자/SAN 관리자에게 다음과 같이 조언해야 합니다.
-
- 새 포트 SFP 및 케이블을 청소해야 합니다. (불결한 케이블의 SFP 오염을 방지하려면 전문 청소 키트를 사용하는 것이 좋습니다.)
- 연결된 디바이스는 해당 디바이스를 지원하는 사람이 추가로 조사해야 합니다.
- Cisco 스위치에서 카운터 증가 없이 "errdisabled" 상태가 다시 발생하면 추가 백엔드 조사를 위해 SR을 열어야 합니다.
- 오류가 증가하지 않거나 Cisco 스위치의 Errdisabled 상태가 다시 발생하지 않는 경우 이전 포트의 SFP에 결함이 있는 것입니다. SFP 교체를 위해 SR을 제출하며 로그 출력, SFP 세부 정보(SM 또는 MM, 속도 등)를 포함하여 위의 분석 결과를 제공합니다.
Additional Information
하드웨어 오류는 문제에 간단한 알고리듬을 적용하여 쉽게 격리할 수 있습니다. 해당 하드웨어에 오류가 없으면 다른 하드웨어에 오류가 있는 것입니다. 문제가 있는 하드웨어를 가리키는 오류가 격리될 때까지 반복합니다.
Brocade 예:
Connectrix B-Series: Brocade porterrshow 출력을 해석하는 방법 및 카운터의 의미 자체 도움말
예 1 ENC OUT과 LINK FAIL 및 LOSS SYNC:
porterrshow : CURRENT CONTEXT -- 3 , 111 frames enc crc crc too too bad enc disc link loss loss frjt fbsy c3timeout pcs tx rx in err g_eof shrt long eof out c3 fail sync sig tx rx err xx: 849.1k 493.2k 0 0 0 0 0 0 2.3m 0 4 6 0 0 0 0 0 0
일반적인 이유:
포트 통계가 지난 24시간 이내에 삭제된 경우에만 유효합니다. 그렇지 않으면 이러한 카운터를 기간별로 분류합니다. (위의 9번 항목과 같이) 포트 통계를 지우고, 카운터를 확인하고, 4~6시간 후에 데이터를 다시 가져옵니다.
오류에서 link fail, loss sync 및 enc out 오류를 볼 수 있으며, 여기에는 loss sig 오류도 포함될 수 있습니다.
이러한 오류 조합은 일반적으로 호스트 재부팅 또는 스위치 외부의 링크 재설정을 나타냅니다. enc out 오류는 링크 초기화의 일부로 속도 협상 중에 발생합니다.
예상 조치:
포트에 연결된 디바이스가 오프라인 및/또는 온라인으로 전환해야 하는 정당한 이유가 있는지 확인합니다. 호스트 재부팅을 예로 들 수 있습니다. 그렇지 않은 경우 SR을 제출하십시오.
예 2 ENC OUT:
porterrshow : CURRENT CONTEXT -- 3 , 111 frames enc crc crc too too bad enc disc link loss loss frjt fbsy c3timeout pcs tx rx in err g_eof shrt long eof out c3 fail sync sig tx rx err xx: 849.1k 493.2k 0 0 0 0 0 0 2.3m 0 0 0 0 0 0 0 0 0
일반적인 이유:
포트 통계가 지난 24시간 이내에 삭제된 경우에만 유효합니다. 그렇지 않으면 이러한 카운터를 기간별로 분류합니다. (위의 9번 항목과 같이) 포트 통계를 지우고, 카운터를 확인하고, 4~6시간 후에 데이터를 다시 가져옵니다.
관련 오류가 없는 enc out 오류는 케이블이 더러워졌음을 나타냅니다.
예상 조치:
이 포트 및 연결된 디바이스에 연결된 케이블 및 SFP의 모든 광학면을 검사하고 청소합니다.
예 3 CRC 및 CRC G_EOF:
porterrshow : CURRENT CONTEXT -- 3 , 111 frames enc crc crc too too bad enc disc link loss loss frjt fbsy c3timeout pcs tx rx in err g_eof shrt long eof out c3 fail sync sig tx rx err xx: 849.1k 493.2k 0 1.2k 1.2k 0 0 0 0 0 0 0 0 0 0 0 0 0
일반적인 이유:
포트 통계가 지난 24시간 이내에 삭제된 경우에만 유효합니다. 그렇지 않으면 이러한 카운터를 기간별로 분류합니다. (위의 9번 항목과 같이) 포트 통계를 지우고, 카운터를 확인하고, 4~6시간 후에 데이터를 다시 가져옵니다.
프레임이 불량 CRC가 있는 스위치 포트로 들어가고 있지만 프레임 끝은 여전히 양호로 표시됩니다.
이는 불량 프레임을 등록하는 첫 번째 포트임을 나타내므로 문제는 이 특정 포트의 SFP/케이블/연결된 디바이스 인터페이스인 것입니다.
예상 조치:
해결 방법의 기본 작업을 참조하십시오.
ISL 포트의 경우 (위의 9번 항목과 같이) 통계를 지우고, 카운터를 확인하고, 4~6시간 후에 데이터를 다시 가져오고, 두 스위치 모두에서 supportsave를 수집하고 SR을 열어 일반적인 문제 해결을 진행합니다.
예 4 CRC:
porterrshow : CURRENT CONTEXT -- 3 , 111 frames enc crc crc too too bad enc disc link loss loss frjt fbsy c3timeout pcs tx rx in err g_eof shrt long eof out c3 fail sync sig tx rx err xx: 849.1k 493.2k 0 1.2k 0 0 0 0 0 0 0 0 0 0 0 0 0 0
일반적인 이유:
포트 통계가 지난 24시간 이내에 삭제된 경우에만 유효합니다. 그렇지 않으면 이러한 카운터를 기간별로 분류합니다. (위의 9번 항목과 같이) 포트 통계를 지우고, 카운터를 확인하고, 4~6시간 후에 데이터를 다시 가져옵니다.
포트가 불량 CRC 프레임과 함께 스위치에 들어가는 프레임을 기록하고 있지만 해당 프레임은 이미 불량으로 표시되어 있습니다. 일반적으로 ISL 및 NPIV F 포트에서 볼 수 있습니다.
예상 조치:
CRC 오류가 NPIV 포트에 로깅되면 유지 보수 공급업체에 디바이스 조사를 맡기십시오!
ISL 포트의 경우 패브릭의 모든 포트에서 crc g_oef 포트 로깅을 확인하고 예 3과 같은 조치를 취합니다.
예 5 PCS ERR과 LINK FAIL 및 LOSS SYNC:
porterrshow : CURRENT CONTEXT -- 3 , 111 frames enc crc crc too too bad enc disc link loss loss frjt fbsy c3timeout pcs tx rx in err g_eof shrt long eof out c3 fail sync sig tx rx err xx: 849.1k 493.2k 0 0 0 0 0 0 0 0 4 4 0 0 0 0 0 466
일반적인 이유:
포트 통계가 지난 24시간 이내에 삭제된 경우에만 유효합니다. 그렇지 않으면 이러한 카운터를 기간별로 분류합니다. (위의 9번 항목과 같이) 포트 통계를 지우고, 카운터를 확인하고, 4~6시간 후에 데이터를 다시 가져옵니다.
이는 10Gbps 또는 16Gbps 이상 포트(6505/6510/6520/DCX-8510)를 지원하는 플랫폼에만 적용되며, GEN5 플랫폼인 Condor3 ASIC과 함께 도입되었습니다.
ER_PCS_BLK는 PCS(Physical Coding Sublayer) 블록 오류의 수를 표시합니다. 이 카운터는 8Gb/4Gb 링크에 대한 enc_out과 동일하며 10GB 및 16GB 이상 속도에만 사용됩니다.
오류에서 link fail, loss sync 및 pcs err 오류를 볼 수 있으며, 여기에는 loss sig 오류도 포함될 수 있습니다.
이러한 오류 조합은 일반적으로 호스트 재부팅 또는 스위치 외부의 링크 재설정을 나타냅니다.
pcs err 오류는 링크 초기화의 일부로 속도 협상 중에 발생합니다.
예상 조치:
포트에 연결된 디바이스가 오프라인 및/또는 온라인으로 전환해야 하는 정당한 이유가 있는지 확인합니다. 호스트 재부팅을 예로 들 수 있습니다. 그렇지 않은 경우 SR을 제출하십시오.
예 6 PCS ERR:
porterrshow : CURRENT CONTEXT -- 3 , 111 frames enc crc crc too too bad enc disc link loss loss frjt fbsy c3timeout pcs tx rx in err g_eof shrt long eof out c3 fail sync sig tx rx err xx: 849.1k 493.2k 0 0 0 0 0 0 0 0 0 0 0 0 0 0 0 466
일반적인 이유:
포트 통계가 지난 24시간 이내에 삭제된 경우에만 유효합니다. 그렇지 않으면 이러한 카운터를 기간별로 분류합니다. (위의 9번 항목과 같이) 포트 통계를 지우고, 카운터를 확인하고, 4~6시간 후에 데이터를 다시 가져옵니다.
관련 오류가 없는 PCS ERR 오류는 케이블이 더러워졌음을 나타냅니다.
예상 조치:
이 포트 및 연결된 디바이스에 연결된 케이블 및 SFP의 모든 광학면을 검사하고 청소합니다.
CISCO 예:
예 1 Errdisabled:
Errdisabled - 인터페이스 오류 증가 없음
fc1/1 is down (Error disabled - bit error rate too high) Hardware is Fibre Channel, SFP is short wave laser w/o OFC (SN). 5 minutes input rate 0 bits/sec, 0 bytes/sec, 0 frames/sec 5 minutes output rate 0 bits/sec, 0 bytes/sec, 0 frames/sec 179 frames input, 7668 bytes 0 discards, 0 errors 0 CRC, 0 unknown class 0 too long, 0 too short 23 frames output, 1320 bytes 0 discards, 0 errors 1 input OLS, 1 LRR, 0 NOS, 1 loop inits 2 output OLS, 0 LRR, 0 NOS, 1 loop inits Interface last changed at Thu Jun 5 01:51:00 2014
일반적인 이유:
인터페이스의 "Errdisabled" 상태는 인터페이스 카운터가 프런트엔드에서는 깨끗할 수 있고 스위치가 "errdisabled" 상태의 포트를 다운시키는 것처럼 보이며 백엔드(ASIC/내부/라인 카드)에서 오류 카운터가 증가하기 때문에 다소 오해의 소지가 있을 수 있습니다.
예상 조치:
해결 방법의 기본 작업을 참조하십시오. 다시 발생하는 경우 기술 지원 세부 정보 출력을 수집하고 SR을 엽니다.
- 결함이 있거나 불량한 케이블
- SFP 결함 또는 불량
- SFP가 1Gbps에서 작동하도록 지정되었지만 2Gbps에서 사용됨
- SFP가 2Gbps에서 작동하도록 지정되었지만 4Gbps에서 사용됨
- 단거리 케이블이 장거리에 사용되거나 장거리 케이블이 단거리에 사용됨
- 일시적인 동기화 손실
- 한쪽 또는 양쪽 끝의 케이블 연결이 느슨함
- 한쪽 또는 양쪽 끝에서 SFP 연결이 잘못됨
5분 동안 15개의 오류 버스트가 발생하면 비트 오류율 임계값이 감지됩니다. 기본적으로 스위치는 임계값에 도달하면 인터페이스를 비활성화합니다. 아래 명령을 순서대로 입력하여 인터페이스를 다시 활성화할 수 있습니다.
shutdown
no shutdown 임계값을 초과할 때 인터페이스를 비활성화하지 않도록 스위치를 구성할 수 있습니다.
기본적으로 임계값은 인터페이스를 비활성화합니다.
예 2: CRC
CRC 증가
fc13/1 is down (Initializing)
Port description is ***
Hardware is Fibre Channel, SFP is long wave laser cost reduced.
5 minutes input rate 32 bits/sec, 4 bytes/sec, 0 frames/sec
5 minutes output rate 32 bits/sec, 4 bytes/sec, 0 frames/sec
162 frames input, 6136 bytes
0 discards, 17 errors
17 CRC, 0 unknown class
0 too long, 17 too short
74 frames output, 6304 bytes
2 discards, 0 errors
108 input OLS, 54 LRR, 2 NOS, 0 loop inits
83 output OLS, 26 LRR, 56 NOS, 0 loop inits
Interface last changed at Tue May 27 08:37:20 2014
일반적인 이유:
포트가 불량 CRC가 있는 스위치로 들어가는 프레임을 기록하고 있지만 프레임 끝은 양호합니다. CRC 카운터는 오류를 로깅하는 특정 수신 포트에서만 증가하며 이 물리적 링크에서 모든 조사를 수행해야 합니다.
예상 조치:
해결 방법의 기본 작업을 참조하십시오.
(위의 9번 항목과 같이) 포트 통계를 지우고, 카운터를 확인하고, 4~6시간 후에 데이터를 다시 가져옵니다.
예 3: NOS
NOS(Non-Operational Sequence)
show int fc1/1 counters
fc1/1
5 minutes input rate 1753296 bits/sec, 219162 bytes/sec, 199 frames/sec
5 minutes output rate 2310384 bits/sec, 288798 bytes/sec, 194 frames/sec
2741512190 frames input, 2542476084276 bytes
0 class-2 frames, 0 bytes
2741512190 class-3 frames, 2542476084276 bytes
0 class-f frames, 0 bytes
0 discards, 0 errors, 0 CRC
0 unknown class, 0 too long, 0 too short
3410405365 frames output, 5164364339412 bytes
0 class-2 frames, 0 bytes
3410405365 class-3 frames, 5164364339412 bytes
0 class-f frames, 0 bytes
0 discards, 0 errors
1 input OLS, 1 LRR, 0 NOS, 307 loop inits
289 output OLS, 289 LRR, 289 NOS, 289 loop inits
0 link failures, 0 sync losses, 0 signal losses
48276 BB credit transitions from zero
16 receive B2B credit remaining
3 transmit B2B credit remaining
3 low priority transmit B2B credit remaining
일반적인 이유:
링크 협상 전에 연결이 끊어졌습니다.
예상 조치:
계층 1(물리적 계층)과 소스 디바이스를 확인합니다.