Skip to main content
  • Place orders quickly and easily
  • View orders and track your shipping status
  • Enjoy members-only rewards and discounts
  • Create and access a list of your products
  • Manage your Dell EMC sites, products, and product-level contacts using Company Administration.

Connectrix B-switchen Defekter FOS-849642 &FOS-847091 – Styrenheter och switchar i Gen 7 kan stöta på ett feltillstånd som orsakar CRC-fel, portfel eller orsakar en störande omstart

Summary: Gen 7-styrenheter och switchar (X7-8, X7-4, 7730 och 7720) som kör alla versioner av Fabric OS (FOS) v9.1.x före v9.1.1c eller som körs på FOS v9.2.0 kan stöta på ett feltillstånd som orsakar CRC-fel, portfel eller orsakar ett störande omstart som svar på allvarlig överbelastning och aktivering av överprenumereringshanteringsbeteendet hos Funktionen Traffic Optimizer Defekter FOS-849642 &FOS-847091 Dessa två defekter korrigeras i FOS v9.1.1c och v9.2.0a. I väntan på den här kvalificeringen kan kunder som berörs välja att implementera lösningen. ...

This article may have been automatically translated. If you have any feedback regarding its quality, please let us know using the form at the bottom of this page.

Article Content


Symptoms

Produkter som påverkas
Brocade X7-8, X7-4, 7730 och 7720 som kör FOS v9.1.x eller FOS v9.2.0
korrigeras i versionerna
Brocade FOS v9.1.1c, v9.2.0a och senare versioner

. Endast Gen 7-produkter är i riskzonen.
Gen 7-styrenheter (X7-8 och X7-4) med en FC64-48- eller FC32-X7-48-portblad installerad riskerar att drabbas av både spill- och verifieringsfel. FC32-64- och FC32-48-portblad som är installerade i Gen 7-styrenheterna riskerar inte att drabbas av något av felen.
Gen 7-switchar (G730 och G720) riskerar bara att drabbas av buffertöverflyttningsfel. De här switcharna är inte exponerade och riskerar inte heller att drabbas av felet
"verify" (verifiera).För att ytterligare utgöra en risk måste strukturen överbelastas allvarligt, vilket resulterar i överprenumereringshantering av Traffic
Optimizer. Följande RASlog-meddelande observeras om den här nivån av svar någonsin påträffades:
[TO-1006], 1011618/1002267, FID 128, INFO, Switch_100, Flöden som är avsedda för dev02-enheten har flyttats till PG_OVER_SUBSCRIPTION_4G_16G PG., cfs_ctrlr.c, rad: 1470, comp:cfsd, ltime:2023/05/17-06:15:33:923058
Överprenumereringshanteringsåtgärden av Traffic Optimizer finns bara i DEN fasta FOS-programvaran v9.1.x. Gen 7-produkter
som körs på FOS v9.0.x riskerar inte något av feltillstånden.


Buffertöverspillsfel – Risktillstånd
F-portarna på Gen 7-styrenheten
eller -switchen måste även ha konfigurerats från standardvärdet till ett större antal buffertar för att buffertöverflyttningstillståndet ska inträffa. FOS tilldelar
som standard högst 28 buffertar.
Alla Gen 7-directorr eller switchar som har fått sitt maximala antal F-portbuffert högre än standardvärdena som används av
FOS är potentiellt i riskzonen, och alla X7-8- eller X7-4-directorr som tidigare körde FOS v9.0.x kan riskerar att
stöta på "verifieringsfel". I båda fallen måste Traffic Optimizer även försöka hantera routning av ramar som
svar på en överprenumereringshändelse som orsakats av allvarlig överbelastning.

För att fastställa vilka styrenheter och switchar som kan vara i riskzonen använder du kommandot "portbuffershow" för att visa buffertanvändningen
image.png
Om den totala buffertanvändningen för portar på samma ASIC/chip som också är zonade tillsammans lägger till upp till ett värde som är större än 256 buffertar anses Gen 7-switchen vara i riskzonen för att stöta på en buffertöverskridande om en allvarlig överbelastningshändelse kräver översubskriptionshantering från Traffic Optimizer. Felet uppstår inte i alla hanteringshändelser för överprenumerering, eftersom antalet buffertar som hanteras vid tidpunkten för händelsen måste överskrida 256 medan Traffic Optimizer hanterar överprenumerering, men om det konfigureras för att potentiellt hantera fler än 256 buffertar utsätts switchen för risk.
I exemplet ovan riskerar switchen att drabbas av ett buffertspill
om alla åtta F-portar ingår i en zon samtidigt som Traffic Optimizer hanterar ett överprenumereringstillstånd eftersom det totala antalet buffertanvändningar i det här exemplet är 360.
Men i följande exempel där F-portarna inte alla är zonade tillsammans skulle den här switchen inte vara i riskzonen eftersom de två zonerna (visas i grönt) totalt upp till 232 buffertar och 128 buffertar.
image.png
Det maximala antalet portar som används för hantering av överprenumerering är 8 portar. Om fler än 8 portar zonas tillsammans från samma ASIC/krets utgör du de 8 portar som har högst buffertanvändningsvärden för att fastställa risken.

OBSERVERA: Gen 7-styrenheter och switchar som aldrig fått sitt F-Port-buffertantal ändrat från standard är inte i riskzonen för att drabbas av det här problem med buffertspill. Det maximala värdet som används som standardinställning för max/reserverade buffertar är 28 för Gen 7-produkter, men färre buffertar kan allokeras beroende på switchtyp och optisk hastighet. Kunder
som aldrig har ökat antalet maximala/reserverade buffertar från standardvärdena stöter inte på buffertöverflyttningsproblemet
. Även med åtta portar indelade tillsammans är det totala värdet för maximal buffertanvändning endast 224 ramar som använder den maximala standardtilldelningen på 28 buffertar per port, med användning av
den maximala standardallokeringen av 28 buffertanvändningar.

"Verifiera" felrisktillstånd
Utöver buffertspillproblemet kan X7-8- och X7-4-styrenheterna potentiellt också utsättas för en risk för att "verifiera" felmeddelanden om följande villkor uppfylls i den här ordningen:
  • X7-8- eller X7-4-director som tidigare kördes på FOS v9.0.x
  • Directorn uppgraderas sedan till FOX v9.1.x
  • Styrenheten har sedan F-portar som loggar ut och loggar in i version v9.1.x
  • Directorn stöter sedan på en överprenumereringshändelse som kräver hantering från Traffic Optimizer
  • Directorn utför sedan en HA-fail-over (uppgradering av fast programvara leder till fail-over)
  • Directorn stöter på en annan överprenumereringshändelse som kräver hantering från Traffic Optimizer 
X7-8- eller X7-4-styrenheter som uppfyller alla dessa villkor i den angivna sekvensen kan utsättas för risk för att "verifiera" fel under överprenumereringshantering från Traffic Optimizer.
  • X7-8- eller X7-4-styrenheter som bara har körts på FOS v9.1.x fast programvara riskerar inte att drabbas av felet "verify" eftersom endast programmeringsmodellen för v9.1 används för alla portar. Gen 7-styrenheter måste tidigare ha körts med FOS v9.0.x för att vara mottagliga för problemet.
  • X7-8- eller X7-4-styrenheter som har kallstartats/startats om medan den körs på FOS v9.1.x-programvaran riskerar inte heller att drabbas av "verifiera"-felet eftersom alla portar använder v9.1-programmeringen efter omstart

Symtom
Gen 7-styrenheter och switchar som har påträffat en överprenumereringshanteringshändelse observerar följande
trafikoptimer-RASlog:
[TO-1006], 1011618/1002267, FID 128, INFO, Switch_100, Flöden som är avsedda för b1a02-enheten har flyttats till PG_OVER_SUBSCRIPTION_4G_16G PG., cfs_ctrlr.c, rad: 1470, comp:cfsd, ltime:2023/05/17-06:15:33:923058
Ytterligare symptom som kan uppstå på grund av dessa identifierade problem kan vara:
  • Ett stort antal CRC-fel på en länk kan observeras som inte åtgärdas när du byter ut optisk/kabel
  • Ramar kan kasseras, kredit på en länk kan gå förlorad
  • Portar kan vara skadade, ASIC kan stanna och vara defekt
  • En styrenhet kan observera en oväntad ha-fail-over eller en kall omstart av styrenheten
  • Switchar kan kallstartas

Cause

Överskrivningshantering av funktionen Traffic Optimizer under specifika förhållanden kan orsaka felscenarier
som påverkar överföringen av ramar eller portar som hanteras. Vid allvarliga överbelastningsscenarier kan dessa fel också
påverka prestandan hos andra FOS-daemons (Fabric OS), aktiva på switchen, vilket leder till tidsgränser
för programvaruövervakning som leder till fail-over-fel eller switchkrasch.

Gen 7-styrenheter och switchar (X7-8, X7-4, 7730 och 7720) som stöter på ett spill av bildrutebuffertar när du försöker
hantera och omdirigera övertecknade flöden som svar på en allvarlig överbelastningshändelse kan orsaka oväntade fel. Om
antalet bildrutor överskrider bufferten som används för att hantera överprenumereringshanteringen kan
dessa överflödiga ramar missas under hanteringen av trafikoptimeraren. Dessa överflödiga ramar kan eventuellt skrivas över av andra ramar, vilket leder
till att CRC-fel ramas eller till och med portfel om rubrikinformation skrivs över. Vid allvarliga överbelastningsscenarier kan hanteringen av dessa spill/överflödiga ramar leda till blockering av andra FOS-daemons, vilket kan leda till
tidsgränser för övervakning. Kritiska daemons som timeout kommer att orsaka en HA fail-over eller störande switchomstart.

Utöver potentiell ramöverflyttningshantering kan X7-8- och X7-4-styrenheter som tidigare har fungerat på FOS v9.0.x och senare uppgraderats till FOS v9.1.x stöta på verifieringsfel efter HA-fail-overs (inklusive de som orsakas av uppgraderingar av fast programvara till högre versioner av v9.1.x). Flera "verifiera"-felmeddelanden observeras under hanteringen av överprenumereringen av Traffic Optimizer på grund av en detekterad konflikt i programmeringen av portar som skapas när vissa portar, men inte alla portar, återställs under v9.1.x. Konflikten mellan programmering av överbelastningshantering på portar som aldrig återställdes vid v9.0.x och sedan senare påträffade trängselhantering vid v9.1.x på portar som återställdes kan uppstå efter en HA-fail-over-händelse.

Resolution

Tillfällig lösning
" At risk" kan styrenheter och switchar inaktivera hanteringsåtgärden för Traffic Optimizer-överprenumerering.
Utfärda följande CLI-kommando från underhållskontot för att avaktivera beteendet för hantering av överprenumerering
i Traffic Optimizer
underhåll> serviceexec trafoptdebug --enableosclassification 0
Obs! Underhållskommandot måste köras på alla logiska switchar i chassit.
OBSERVERA: Inställningen kommer att vara beständig för failover- och strömcykler

Korrigerande åtgärd
A-programvarulösning som tillhandahålls i FOS v9.1.1c och senare förhindrar dessa fel. Samma lösningar tillhandahålls
även i FOS v9.2.0a och senare versioner av FOS v9.2.x. Uppgradering till dessa versioner av FOS förhindrar en överskridande av ramar på grund av
överprenumereringshantering och förhindrar även "verifieringsfel" för X7-styrenheter.

För alla Gen 7-directorr eller -switchar (X7-8, X7-4, 7730 och 7720) som fortfarande kör en version av FOS v9.0.x och kan vara "i riskzonen"
för att stöta på de problem som beskrivs rekommenderar vi att du väntar på att FOS v9.1.1c släpps innan du uppgraderar.

Gen 7-styrenheter och switchar som för närvarande används på en v9.1.x- eller v9.2.0-version och som bedöms vara i riskzonen bör
implementera tillfälliga lösningar. Om du avaktiverar hanteringsåtgärden för Traffic Optimizer-överprenumereringen förhindras att
både buffertöverskridanden och "verifiera"-fel inträffar. Efter uppgradering till v9.1.1c eller v9.2.0a kan hanteringsåtgärden för överprenumerering
återaktiveras via följande kommando:
Utfärda följande CLI-kommando från underhållskontot för att återaktivera överprenumereringshanteringsåtgärden i Traffic Optimizer
underhåll> serviceexec trafoptdebug --enableosclassification 1
Obs! Underhållskommandot måste köras på alla logiska switchar i chassit.

Alla Gen 7-directorr eller -switchar som redan har påträffat "buffertöverflyttningsfel" måste kallomstartas
för att helt återställas från feltillståndet:
Direktörer: Kortplatsström av/på de berörda portbladsswitcharna
: Starta om switchen (kallstart)
Alternativ 1: Utför omstartsåtgärden som visas ovan och implementera sedan tillfälliga lösningar för att avaktivera åtgärden för hantering av överprenumerering inifrån Traffic Optimizer
, alternativ 2: Uppgradera till en version av FOS med lösningen och utför sedan omstartsåtgärden som visas ovan.

Uppgradering till en version av FOS med den tillhandahållna lösningen förhindrar att "buffertöverflyttningsfelet" inträffar, men
när feltillståndet påträffas kommer endast en kall omstart av ASIC att lösa feltillståndet.
Om du uppgraderar till en version av FOS med den tillhandahållna lösningen förhindras och återställs automatiskt från feltillståndet
"verifiera" utan ytterligare åtgärder.

Efter uppgradering till en version av FOS som innehåller lösningen utförs en kontroll av internt minne för att avgöra om directorn eller switchen tidigare har påträffat felet och kräver en omstart för att återställas från feltillståndet.
Följande RASlog visas om feltillståndet upptäcks efter uppgradering av FOS till en version med lösningen:
2023/06/01-17:07:50 (GMT), [C5-1057], 5, KORTPLATS 2 | CHASSI, CRITICAL, Switch_3,
S10, C0: HW ASIC-chipet är i ett inkonsekvent läge = 0x1002.
Om ovanstående RASlog observeras efter uppgradering av FOS har directorn eller switchen tidigare stött på "buffertöverflyttning
" före uppgraderingen och behöver utföra en kall omstart för att helt återställa från feltillståndet:
Direktörer: Kortplatsström av/på de berörda portbladsswitcharna
: Starta om switchen (kallstart)

Article Properties


Affected Product

Connectrix DS-7720B, Connectrix DS-7730B, Connectrix ED-DCX7-4B, Connectrix ED-DCX7-8B

Last Published Date

26 Oct 2023

Version

3

Article Type

Solution