PowerVault ME5: 호스트 링크 PHY 오류 수가 오류 임계값보다 큼
Summary: PowerVault ME5 운영자는 호스트 또는 스위치에 연결된 파이버 채널 또는 SAS 컨트롤러 프런트엔드 포트를 사용할 때 종종 이벤트 기록 로그에서 이벤트 663 호스트 링크 PHY 오류 수 메시지를 관찰할 수 있습니다. 이 이벤트는 ME5 펌웨어 버전 ME5.1.2.1.0 이상에서 도입되었습니다.
Instructions
PowerVault ME5 Series 컨트롤러 모듈 구성에 따라 이 문서의 해당 섹션으로 이동합니다.
FC(Fibre Channel) 프런트엔드 포트를 사용하는 컨트롤러
FC(Fibre Channel) SFP 트랜시버를 사용하여 연결된 컨트롤러 모듈이 있는 PowerVault ME5 Series 어레이 운영자는 이 증상을 해결하기 위해 수정 조치를 취해야 할 수 있습니다. 이 메시지는 일반적으로 I/O 처리에 영향을 미치지 않지만, 구성 문제, 잠재적인 하드웨어 또는 SFP 트랜시버나 광섬유 케이블의 연결 문제를 조기에 나타내는 징후입니다.
대부분의 경우 광섬유 케이블의 LC 커넥터 끝면을 올바르게 청소하여 빛 굴절을 방해하는 먼지나 기타 오염 물질을 제거하면 쉽게 해결할 수 있습니다. 광섬유 케이블 커넥터 끝면을 검사하고 청소하는 방법에 대한 지침은 다음 기술 자료 문서의 지침을 따르십시오. 광섬유 커넥터 끝면의 먼지와 같은 오염 물질로 인해 I/O 성능이 저하됩니다.
A41844 2024-08-12 10:45:54 112 INFORMATIONAL Host link down. (port: 1) A41853 2024-08-12 10:46:30 111 INFORMATIONAL Host link up. (port: 1, speed: 32 Gbps, point-to-point, fabric) A42131 2024-10-13 18:44:37 663 ERROR The host link PHY error count is greater than the error threshold. (port: 1, type: ) A42132 2024-10-13 18:46:44 663 RESOLVED The host link PHY error count has been resolved. (port: 1, type: resolved)
PowerVault ME5 어레이 펌웨어 버전 ME5.1.2.1.0 이상은 FC 포트 잘못된 전송 단어 수 메트릭을 모니터링합니다. 이 카운터 값은 단어가 성공적으로 전송되지 않아 인코딩 오류가 발생했음을 의미합니다. 이 카운터 값은 PowerVault Manager 또는 CLI에 표시되지 않지만 각 SC(Storage Controller) 디버그 로그에 기록됩니다. 컨트롤러 SC 디버그 로그는 PowerVault ME 지원 번들 내에서 수집됩니다. 참조: PowerVault ME5: PowerVault 지원 로그를 수집하는 방법
이 ERROR 메시지가 자주 표시되는 경우 운영자는 다음 조치를 취할 수 있습니다.
-
광섬유 케이블 설치를 검사하고 광섬유 케이블 커넥터 단면을 올바르게 청소하고 이벤트 내역 로그를 모니터링하여 이벤트 663이 반복적으로 발생했는지 확인합니다. 광섬유 커넥터 끝면의 먼지와 같은 오염 물질로 인해 I/O 성능이 저하되는 경우를 참조하십시오.
-
광섬유 케이블 커넥터를 청소해도 문제가 해결되지 않으면 정상 작동이 확인된 트랜시버와 광섬유 케이블로 교체합니다. 부품이 손상되지 않았으며 올바르게 취급되고 있는지 확인합니다.
-
트랜시버를 교체해도 증상이 해결되지 않으면 운영자는 Dell PowerVault ME5 Series 스토리지 시스템 Support Matrix에 나온 검증된 트랜시버를 사용해야 합니다. 그렇지 않으면 공급업체에 지원을 문의하십시오.
-
드물지만 이전 세대 8Gb FC 스위치를 사용하는 운영자는 스위치 portCfgFillword 설정을 조정해야 할 수 있습니다. 아래에서 추가 정보 섹션을 참조하십시오.
SAS(Serial Attached SCSI) 프런트엔드 포트를 사용하는 컨트롤러
각 호스트-컨트롤러 SAS 케이블 연결은 둘 이상의 PHY(Physical Link)로 구성된 SAS 와이드 포트를 형성합니다. 각 PHY는 2개의 차동 신호 쌍으로 사용되는 4개의 와이어 세트이므로 데이터를 양방향으로 동시에 전송할 수 있습니다.
일반적으로 이는 I/O 처리에 영향을 미치지 않으며, SAS 링크가 형성되며 SAS 케이블이 삽입될 때 이벤트가 발생합니다. 중복 컨트롤러 구성에서는 연결된 호스트 서버가 호스트 운영 체제 SAS 드라이버를 부팅하고 로드할 때 이벤트 663이 두 컨트롤러에 동시에 기록됩니다. 운영자는 추가 조치를 취할 필요가 없습니다.
추가 고려 사항:
PowerVault ME 컨트롤러가 Dell SAS HBA355e에 연결되는 경우입니다. 호스트 서버 포트 연결은 변경 서버 SAS HBA 또는 SAS HBA 포트 사용 후 Dell HBA355e SAS 컨트롤러에 연결할 때 저하된 PowerVault ME5 Series 보고 호스트 포트 별로 분산될 수 있습니다. PowerVault Manager를 사용하여 포트 이니시에이터 WWN ID가 올바른 호스트 및 볼륨에 매핑되었는지 확인합니다.
SAS 케이블의 양쪽 끝을 살짝 당겨 SAS 케이블이 단단히 삽입되었는지 확인합니다. SAS 케이블이 포트에서 빠진 경우 올바르게 다시 장착합니다. 커넥터 래치가 고정되면 딸깍 소리가 날 수 있습니다. SAS 케이블 커넥터를 제대로 고정할 수 없는 경우 호스트 서버에서 사용 중인 PCI-e 슬롯을 확인하십시오. 섀시 내 SAS HBA의 슬롯 위치가 커넥터 삽입을 방해할 수 있습니다. 자세한 정보는 다음을 참조하시기 바랍니다. PowerEdge 16G 모델: HBA355e PCI-e 슬롯 선택
SAS에 연결된 호스트가 재부팅될 때 샘플 PowerVault ME5 이벤트 내역 로그가 생성됩니다. 두 컨트롤러 모두 이벤트를 기록하며, 시퀀스의 마지막 이벤트는 문제가 해결되었음을 나타냅니다.
B1473 2024-08-15 09:55:22 112 INFORMATIONAL Host link down. (port: 2) A3538 2024-08-15 09:55:26 112 INFORMATIONAL Host link down. (port: 2) B1483 2024-08-15 09:55:29 111 INFORMATIONAL Host link up. (port: 2, type: SAS) A3547 2024-08-15 09:55:32 111 INFORMATIONAL Host link up. (port: 2, type: SAS) A3911 2024-10-22 10:10:46 354 WARNING Host SAS topology was changed. (host port: 2, 0 out of 4 PHYs are up, link speed: Autonegotiated) B1640 2024-10-22 10:10:46 354 WARNING Host SAS topology was changed. (host port: 2, 0 out of 4 PHYs are up, link speed: Autonegotiated) A3912 2024-10-22 10:11:55 354 INFORMATIONAL Host SAS topology was changed. (host port: 2, 4 out of 4 PHYs are up, link speed: 12 Gbps) B1641 2024-10-22 10:11:55 354 INFORMATIONAL Host SAS topology was changed. (host port: 2, 4 out of 4 PHYs are up, link speed: 12 Gbps) A3913 2024-10-22 10:12:58 663 ERROR The host link PHY error count is greater than the error threshold. (port: 2, type: disparity errors, lost dword count, invalid dword count) B1642 2024-10-22 10:13:33 663 ERROR The host link PHY error count is greater than the error threshold. (port: 2, type: disparity errors, lost dword count, invalid dword count) A3914 2024-10-22 10:15:00 663 RESOLVED The host link PHY error count has been resolved. (port: 2, type: resolved)
Additional Information
8Gb를 지원하는 이전 세대 Connectrix 또는 Brocade FC 스위치를 사용하는 운영자는 다음을 통해 fillword 설정을 구성할 수 있습니다. portCfgFillword 명령에 대한 중요한 정보가 있는 매뉴얼을 볼 수 있습니다. 8Gb 스위치가 도입되었을 때 IDLE 대신 ARBff가 채택되었습니다. 주로 낮은 비트 오류에 기여할 수 있기 때문입니다. 초기화에 사용된 IDLE도 fillword 변경과 함께 ARBff로 변경되었습니다.
이전 세대 FC 스위치를 운영 환경에서 계속 사용하는 운영자는 잘못된 전송 단어 수 카운터가 증가하는 것을 관찰할 수 있으며 항상 ARBff를 사용하도록 portcfgfillword 값을 설정해야 합니다. Brocade 스위치에서는 다음과 출력이 나타납니다. "portcfgfillword --help"로 변경되었습니다.
admin> portcfgfillword --help
Usage: portCfgFillWord [SlotNumber/]PortNumber Mode [Passive]
Mode: 0/-idle-idle - IDLE in Link Init, IDLE as fill word (default)
1/-arbff-arbff - ARBFF in Link Init, ARBFF as fill word
2/-idle-arbff - IDLE inLink Init, ARBFF as fill word (SW)
3/-aa-then-ia - If ARBFF/ARBFF failed, then do IDLE/ARBFF
Passive: 0/1
admin>
0: Use IDLE for initialization as 4Gb switches do.
1: Always use ARBff.
2: Use IDLE for initialization and use ARBff for between data frames.
3: Use ARBff for initialization first. If it fails, use IDLE. Use ARBff for between data frames.