Skip to main content
  • Place orders quickly and easily
  • View orders and track your shipping status
  • Enjoy members-only rewards and discounts
  • Create and access a list of your products
  • Manage your Dell EMC sites, products, and product-level contacts using Company Administration.

Connectrix B-Series 스위치: 결함 FOS-849642 및 FOS-847091 - Gen 7 디렉터 및 스위치에 CRC 오류, 포트 장애 또는 중단 재부팅을 유발하는 장애 상태가 발생할 수 있음

Summary: 이전 버전의 FOS(Fabric OS) v9.1.x를 실행하는 Gen 7 디렉터 및 스위치(X7-8, X7-4, 7730 및 7720) v9.1.1c 또는 FOS v9.2.0에서 실행 중인 경우 CRC 오류, 포트 장애 또는 심각한 정체 및 초과 할당 관리 동작 활성화에 대응하여 중단 없는 재부팅 트래픽 최적화 기능 결함 FOS-849642 및 FOS-847091 이 두 가지 결함은 FOS v9.1.1c 및 v9.2.0a에서 수정됩니다. 이 자격이 보류 중인 경우 영향을 받는 고객은 해결 방법을 구현하도록 선택할 수 있습니다. ...

This article may have been automatically translated. If you have any feedback regarding its quality, please let us know using the form at the bottom of this page.

Article Content


Symptoms

영향을 받는
제품릴리즈
Brocade FOS v9.1.1c, v9.2.0a 이상 버전

에서 수정된FOS v9.1.x 또는 FOS v9.2.0
을 실행하는 Brocade X7-8, X7-4, 7730 및 7720은 Gen 7 제품만 위험에 노출됩니다.
FC64-48 및/또는 FC32-X7-48 포트 블레이드가 설치된 Gen 7 디렉터(X7-8 및 X7-4)는 오버플로 및 "확인" 오류가 모두 발생할 위험이 있습니다. Gen 7 디렉터에 설치된 FC32-64 및 FC32-48 포트 블레이드는 어느 오류도 발생할 위험이 없습니다.
Gen 7 스위치(G730 및 G720)는 버퍼 오버플로 장애가 발생할 위험이 있습니다. 이러한 스위치는 "확인" 오류 상태에 노출되지 않으며 "확인" 오류 상태가 발생할 위험이 있습니다.
더 위험하기 위해서는 패브릭이 심각한 정체를 경험해야 하며 이로 인해 Traffic
Optimizer가 초과 할당을 관리해야 합니다. 이 수준의 응답이 발생한 경우 다음 RASlog 메시지가 표시됩니다.
[TO-1006], 1011618/1002267, FID 128, INFO, Switch_100, dev02 디바이스로 향하는 흐름이 PG_OVER_SUBSCRIPTION_4G_16G PG, cfs_ctrlr.c, 라인으로 이동되었습니다. 1470, 보상:cfsd, ltime:2023/05/17-06:15:33:923058
Traffic Optimizer의 초과 할당 관리 작업은 FOS v9.1.x 펌웨어에만 존재합니다. FOS v9.0.x에서 실행되는 Gen 7 제품은
장애 조건 중 하나에 영향을 주지 않습니다.


버퍼 오버플로 장애 위험 조건
버퍼 오버플로 조건이 발생하려면 심각한 정체 기간이 필요할 뿐만 아니라 Gen 7
디렉터 또는 스위치의 F 포트도 기본값에서 더 많은 수의 버퍼로 구성해야 합니다. FOS는
기본적으로 최대 28개의 버퍼를 할당합니다.
FOS에서 사용하는
기본값보다 최대 F-포트 버퍼 수가 증가한 Gen 7 디렉터 또는 스위치는 잠재적으로 위험에 노출될 수 있으며, 이전에 FOS v9.0.x를 실행하던 X7-8 또는 X7-4 디렉터는 "확인" 오류가 발생할 위험이
있습니다. 두 경우 모두 트래픽 최적화자는 심각한 정체 기간 동안 발생하는 초과 할당 이벤트에 대응하여
프레임의 라우팅을 관리해야 합니다.

위험에 노출될 수 있는 디렉터 및 스위치를 확인하려면 "portbuffershow" 명령을 사용하여 버퍼 사용량을
image.png
확인합니다. 또한 조닝된 동일한 ASIC/칩의 포트에 대한 전체 버퍼 사용량이 256개 이상의 버퍼 값에 추가되는 경우 심각한 정체 이벤트가 트래픽 Optimizer에서 초과 할당 관리가 필요한 경우 Gen 7 스위치가 버퍼 오버런이 발생할 위험이 있는 것으로 간주됩니다. 이벤트 시 관리되는 버퍼 수가 초과 할당을 관리하는 동안 관리되는 버퍼 수가 256을 초과해야 하지만 256개 이상의 버퍼를 처리하도록 구성되면 스위치가 위험에 노출되므로 모든 초과 할당 관리 이벤트에서 장애가 발생하지 않습니다.
위의 예 출력에서 8개의 F-포트가 모두 하나의 존에 있는 경우 스위치가 프레임
버퍼 오버플로가 발생할 위험이 있으며, 이 예의 총 버퍼 사용 횟수는 360이므로 Traffic Optimizer가 초과 할당 조건을 관리합니다.
그러나 F-포트가 모두 조닝되지 않은 다음 예에서는 두 영역(녹색으로 표시됨)이 각각 최대 232개의 버퍼와 128개의 버퍼로 구성되므로 이 스위치는 위험하지 않습니다.
image.png
초과 할당 관리에 사용된 최대 포트 수는 8개입니다. 동일한 ASIC/칩에서 8개 이상의 포트가 조인된 경우 버퍼 사용량 값이 가장 높은 포트 8개를 합해 위험을 결정합니다.

참고: F-Port 버퍼 수가 기본값에서 변경된 적이 없는 Gen 7 디렉터 및 스위치는 이 프레임 버퍼 오버플로 문제가 발생할 위험이 없습니다. Max/Reserved Buffers의 기본 설정으로 사용되는 최대값은 Gen 7 제품의 경우 28개이지만 스위치 유형 및 Optic 속도에 따라 더 적은 버퍼를 할당할 수 있습니다. Max/Reserved Buffer 수를 기본값에서 한 번도 늘리지 않은 고객은
버퍼 오버플로
문제가 발생하지 않습니다. 포트가 8개 조인된 경우에도 포트당 최대 28개의 버퍼를 기본 할당하여 최대 버퍼 사용량의
총 값은 224프레임입니다.

"확인" 오류 위험 조건
버퍼 오버플로 문제 외에도 다음 조건이 이 순서로 충족될 경우 X7-8 및 X7-4 디렉터가 오류 메시지를 "확인"할 위험이 있을 수 있습니다.
  • 이전에 FOS v9.0.x에서 실행 중인 X7-8 또는 X7-4 디렉터
  • 그런 다음 디렉터가 FOX v9.1.x로 업그레이드됩니다.
  • 디렉터에는 v9.1.x 버전에서 로그아웃하고 로그인하는 F-포트가 있습니다.
  • 그런 다음 디렉터가 트래픽 최적화 관리자의 관리가 필요한 초과 할당 이벤트가 발생합니다.
  • 그런 다음 디렉터가 HA 페일오버를 수행합니다(펌웨어 업그레이드로 인해 페일오버가 발생).
  • 디렉터가 트래픽 최적화 관리자의 관리가 필요한 또 다른 초과 할당 이벤트가 발생합니다. 
이러한 모든 조건을 충족하는 X7-8 또는 X7-4 디렉터는 지정된 순서대로 Traffic Optimizer에서 초과 할당을 관리하는 동안 "확인" 오류가 발생할 위험이 있습니다.
  • FOS v9.1.x 펌웨어에서만 실행된 X7-8 또는 X7-4 디렉터는 v9.1 프로그래밍 모델만 모든 포트에 사용 중이므로 "확인" 오류가 발생할 위험이 없습니다. 이 문제에 취약하려면 이전에 FOS v9.0.x에서 Gen 7 디렉터를 실행해야 합니다.
  • FOS v9.1.x 펌웨어에서 실행되는 동안 콜드 부팅/전원 주기를 수행한 X7-8 또는 X7-4 디렉터도 재 부팅 후 모든 포트에서 v9.1 프로그래밍을 사용하므로 "확인" 오류가 발생할 위험이 없습니다.

증상
초과 할당 관리 이벤트가 발생한 Gen 7 디렉터 및 스위치에는 다음과 같은
트래픽 최적화 RASlog가 적용됩니다.
[TO-1006], 1011618/1002267, FID 128, INFO, Switch_100, b1a02 디바이스로 향하는 흐름이 PG_OVER_SUBSCRIPTION_4G_16G PG, cfs_ctrlr.c, 라인으로 이동되었습니다. 1470, 보상:cfsd, ltime:2023/05/17-06:15:33:923058
이러한 식별된 문제로 인해 나타날 수 있는 추가 증상은 다음과 같습니다.
  • 옵티컬/케이블 교체로 수정되지 않은 링크에서 많은 수의 CRC 오류가 관찰될 수 있습니다.
  • 프레임은 삭제될 수 있으며 링크의 크레딧은 손실될 수 있습니다.
  • 포트에 장애가 발생할 수 있고, ASIC이 중단되고 장애가 발생할 수 있음
  • 디렉터가 예기치 않은 HA 페일오버 또는 디렉터의 콜드 재시작을 관찰할 수 있습니다.
  • 스위치에서 콜드 재시작이 발생할 수 있음

Cause

특정 조건에서 트래픽 최적화 기능의 초과 할당 관리로 인해 프레임 또는 포트의 전송에 영향을 미치는 장애 시나리오
가 발생할 수 있습니다. 심각한 정체 시나리오에서 이러한 장애는 스위치에서 활성 상태인 다른 FOS(Fabric OS) 데몬의 성능에 영향을 미칠 수 있으며, 이로 인해 소프트웨어 감시 시간 초과
로 인해 HA 페일오버 또는 스위치 패닉이 발생할 수
있습니다.

심각한 정체 이벤트에 대응하여 초과 할당된 흐름을 관리하고 다시 라우팅하는
동안 프레임 버퍼의 오버플로가 발생하는 Gen 7 디렉터 및 스위치(X7-8, X7-4, 7730 및 7720)는 예기치 않은 오류를 일으킬 수 있습니다. 초과 할당 처리를 관리하는 데 사용되는 버퍼를 오버런하는 프레임 수가 많을 경우
트래픽 최적화기 처리 중에 이러한 초과 프레임을 놓칠 수 있습니다
. 이러한 초과 프레임은 헤더 정보를 덮어쓰는 경우 프레임 CRC 오류 또는 포트 오류로 이어지는
다른 프레임에 의해 덮어쓸 수 있습니다. 심각한 정체 시나리오에서 이러한 오버플로/초과 프레임을 관리하면 다른 FOS 데몬이 차단되어 Watchdog 시간 초과가 발생할
수 있습니다. 시간 초과가 HA 페일오버 또는 운영 중단 스위치 재부팅을 유발하는 중요 데몬입니다.

잠재적인 프레임 오버플로 처리 외에도 이전에 FOS v9.0.x에서 작동한 후 나중에 FOS v9.1.x로 업그레이드한 X7-8 및 X7-4 디렉터에서 HA 페일오버 후 확인 오류가 발생할 수 있습니다(더 높은 버전의 v9.1.x로 펌웨어 업그레이드로 인해 발생한 디렉터 포함). v9.1.x에서 일부 포트가 재설정되었지만 일부 포트가 재설정되지 않을 때 생성된 포트 프로그래밍에서 충돌이 감지되어 트래픽 최적화 프로그램이 초과 할당을 관리하는 동안 여러 개의 "확인" 오류 메시지가 관찰됩니다. v9.0.x에서 재설정되지 않은 포트에서의 정체 관리 프로그래밍 간의 충돌과 이후에는 HA 페일오버 이벤트 후 재설정된 포트의 v9.1.x에서 정체 관리가 발생할 수 있습니다.

Resolution

해결 방법
" 위험" 디렉터 및 스위치는 Traffic Optimizer 초과 할당 관리 작업을 비활성화할 수 있습니다.
유지 보수 계정에서 다음 CLI 명령을 실행하여 Traffic Optimizer 내에서 초과 할당
관리 작업 동작을 비활성화합니다.
maintenance> serviceexecoptdebug --enableosclassification 0
참고: 유지 보수 명령은 섀시의 모든 논리 스위치에서 실행되어야 합니다.
참고: 이 설정은 페일오버 및 전원 주기

동안 지속되며 FOS v9.1.1c 이상에서 제공되는수정 조치
A 소프트웨어 솔루션은 이러한 장애를 방지합니다. FOS v9.2.0a 이상 버전의 FOS v9.2.x에도 동일한 솔루션이 제공됩니다
. 이러한 버전의 FOS로 업그레이드하면 초과 할당 관리로 인해 프레임 오버런
이 방지되고 X7 디렉터의 "확인" 오류도 방지됩니다.

여전히 FOS v9.0.x 버전을 실행하는 Gen 7 디렉터 또는 스위치(X7-8, X7-4, 7730 및 7720)의 경우 설명된 문제가 발생할 수
있으므로 업그레이드하기 전에 FOS v9.1.1c의 릴리스를 기다리는 것이 좋습니다.

현재 v9.1.x 또는 v9.2.0 릴리스에서 작동하고 있으며 위험에 처한
것으로 판단되는 Gen 7 디렉터 및 스위치는 해결 방법을 구현해야 합니다. Traffic Optimizer 초과 할당 관리 작업을 비활성화하면 버퍼 오버런과 "확인" 오류가 모두 발생하지 않습니다
. v9.1.1c 또는 v9.2.0a로 업그레이드한 후 다음 명령을 통해 초과 할당
관리 작업을 다시 활성화할 수 있습니다.
유지 보수 계정에서 다음 CLI 명령을 실행하여 Traffic Optimizer 내에서 초과 할당 관리 작업 동작을 다시 활성화합니다.
maintenance> serviceexec mariooptdebug --enableosclassification 1
참고: 유지 보수 명령은 섀시의 모든 논리 스위치에서 실행되어야 합니다.

"버퍼 오버플로" 오류가 이미 발생한 Gen 7 디렉터 또는 스위치는 장애 상태에서 완전히 복구하려면 콜드 재시작
을 수행해야 합니다.
감독: 영향을 받은 포트 블레이드
스위치의 슬롯 전원 끄기/켜짐: 스위치 재부팅(콜드 재시작)
옵션 1: 위에 표시된 재부팅 작업을 수행한 다음 해결 방법을 구현하여 트래픽 최적화
옵션 2 내에서 초과 할당 관리 작업을 비활성화합니다. 솔루션을 사용하여 FOS 버전으로 업그레이드한 다음 위에 표시된 재부팅 작업을 수행합니다.

제공된 솔루션을 사용하여 FOS 버전으로 업그레이드하면 "버퍼 오버플로" 오류가 발생하지 않지만
장애가 발생한 상태가 발생하면 ASIC의 콜드 재시작만 실패 상태를 해결합니다.
제공된 솔루션을 사용하여 FOS 버전으로 업그레이드하면 추가 조치 없이 "확인" 오류
상태를 방지하고 자동으로 복구할 수 있습니다.

솔루션이 포함된 FOS 버전으로 업그레이드한 후 내부 메모리 검사를 수행하여 디렉터 또는 스위치에서 이전에 장애가 발생했으며 오류 상태에서 복구하기 위해 재부팅이 필요한지 확인합니다.
솔루션으로 FOS를 버전으로 업그레이드한 후 장애 조건이 감지되면 다음 RASlog가 표시됩니다.
2023/06/01-17:07:50(GMT), [C5-1057], 5, 슬롯 2 | 섀시, 위험, Switch_3,
S10,C0: HW ASIC 칩이 일관되지 않은 상태 = 0x1002.
FOS를 업그레이드한 후 위의 RASlog가 관찰된 경우 디렉터 또는 스위치에서 업그레이드 전에 이전에 "버퍼
오버플로" 오류가 발생했으며 장애 상태에서 완전히 복구하려면 콜드 재시작을 수행해야 합니다.
감독: 영향을 받은 포트 블레이드
스위치의 슬롯 전원 끄기/켜짐: 스위치 재부팅(콜드 재시작)

Article Properties


Affected Product

Connectrix DS-7720B, Connectrix DS-7730B, Connectrix ED-DCX7-4B, Connectrix ED-DCX7-8B

Last Published Date

26 Oct 2023

Version

3

Article Type

Solution