Skip to main content
  • Place orders quickly and easily
  • View orders and track your shipping status
  • Enjoy members-only rewards and discounts
  • Create and access a list of your products
  • Manage your Dell EMC sites, products, and product-level contacts using Company Administration.

Connectrix B-seriens switch: Defekter FOS-849642 & FOS-847091 – Gen 7-chefer og -switche kan støde på en fejltilstand, der forårsager CRC-fejl, portefejl eller forårsager en forstyrrende genstart

Summary: Gen 7-direktører og -switche (X7-8, X7-4, 7730 og 7720), der kører en version af Fabric OS (FOS) v9.1.x før v9.1.1c eller kørsel på FOS v9.2.0 kan støde på en fejltilstand, der forårsager CRC-fejl, portfejl eller forårsager en afbrudt genstart som følge af alvorlig overbelastning og aktivering af overabonnementsadministrationsadfærden for Trafikoptimeringsfunktion Defekte FOS-849642 & FOS-847091 Disse to fejl vil blive rettet i FOS v9.1.1c og v9.2.0a. Afventer denne kvalifikation, kan kunder, der er berørt, vælge at implementere løsningen. ...

This article may have been automatically translated. If you have any feedback regarding its quality, please let us know using the form at the bottom of this page.

Article Content


Symptoms

Berørte
produkterBrocade X7-8, X7-4, 7730 og 7720, der kører FOS v9.1.x eller FOS v9.2.0
Korrigeret i udgivelser
Brocade FOS v9.1.1c, v9.2.0a og højere versioner

Kun Gen 7-produkter er i fare.
Gen 7-direktører (X7-8 og X7-4) med en FC64-48 og/eller FC32-X7-48-portblade installeret er i risiko for at støde på både overløbs- og "verificeringsfejl". FC32-64- og FC32-48-portblade, der er installeret i Gen 7-direktører, er ikke i risiko for at støde på nogen af dem.
Gen 7-switche (G730 og G720) er kun i risiko for at støde på bufferoverløbsfejl. Disse switche er ikke eksponeret for, og de er heller ikke i risiko for at støde på fejltilstanden "verificer".
For yderligere at være udsat for risiko skal strukturen opleve alvorlige overbelastninger, hvilket resulterer i overadministration af Trafik
Optimizer. Følgende RASlog-meddelelse vil blive observeret, hvis dette responsniveau nogensinde er fundet:
[TO-1006], 1011618/1002267, FID 128, INFO, Switch_100, strømme med destinationen dev02-enhed, er blevet flyttet til PG_OVER_SUBSCRIPTION_4G_16G PG., cfs_ctrlr.c, linje: 1470, comp:cfsd, ltime:2023/05/17-06:15:33:923058
Trafikoptimeringshandlingens overadministrationshandling findes kun i FOS v9.1.x-firmware. Gen 7-produkter
, der kører på FOS v 9.0.x, er ikke i fare for nogen af fejltilstandene.


Fejlrisici
for bufferoverløbFor at bufferoverløbstilstanden kan forekomme, skal F-portene på Gen 7-directoren
eller switchen også være konfigureret fra standardværdien til et større antal buffere, for at bufferoverløbstilstanden kan forekomme. FOS tildeler
som standard højst 28 buffere.
Enhver Gen 7 director eller switch, der har fået deres maksimale F-Port-buffertællinger øget over standardværdierne, der anvendes af
FOS, er potentielt i fare, og enhver X7-8- eller X7-4-director, der tidligere kørte FOS v9.0.x, kan være i risiko for at
støde på "verificer"-fejl. I begge tilfælde skal Trafikoptimering også forsøge at administrere routing af rammer som følge
af en overopdringshændelse, der forårsages i en periode med alvorlige overbelastninger.

For at bestemme bestyrelsesmedlemmer og switche, der kan være udsat for risiko, skal du bruge kommandoen "portbuffershow" til at få vist bufferforbruget. Hvis det samlede bufferforbrug
image.png
for porte på samme ASIC/chip, der også er zoneopdelt sammen, resulterer i en værdi på mere end 256 buffere, anses Gen 7-switchen for at være i risiko for at støde på bufferoverløb, hvis en alvorlig overbelastningshændelse kræver overadministration fra Trafikoptimering. Fejlen vil ikke blive fundet på alle overabonnementstyringshændelser, da antallet af buffere, der administreres på tidspunktet for hændelsen, skal overstige 256, mens Traffic Optimizer administrerer overopdelt abonnement, men som konfigureres til potentielt at håndtere mere end 256 buffere, vil udsætte switchen for risiko.
Hvis alle 8 F-porte er i én zone sammen i det eksempel på output, der vises ovenfor, er der risiko for, at switchen støder på et rammebufferoverløb
, mens Trafikoptimering administrerer en overopdelt tilstand, da det samlede bufferforbrug i dette eksempel er 360.
I følgende eksempel, hvor F-portene ikke alle er zoneinddelt sammen, vil denne switch ikke være i fare, da de to zoner (vist i grøn) i alt er op til henholdsvis 232 buffere og 128 buffere.
image.png
Det maksimale antal porte, der anvendes til administration af overabonnementer, er 8 porte. Hvis mere end 8 porte er zonelagret sammen fra samme ASIC/chip, skal de 8 porte i alt have de højeste bufferforbrugsværdier for at bestemme risikoen.

BEMÆRK: 7. gen. direktører og switche, der aldrig har fået ændret deres F-Port-buffertællinger fra standard, er ikke i risiko for at opleve dette problem med rammebufferoverløb. Den maksimale værdi, der bruges som standardindstilling for maks./reserverede buffere, er 28 for Gen 7-produkter, men der kan tildeles færre buffere afhængigt af switchtype og optikhastighed. Kunder
, der aldrig har øget deres antal maks./reserverede buffere fra standarden, vil ikke opleve et problem med bufferoverløb
. Selv med 8 porte indzonet sammen, med den maksimale standardallokering på 28 buffere pr. port, er den samlede værdi af
maksimal bufferbrug kun 224 rammer.

"Bekræft" fejlrisikobetingelser
Ud over problemet med bufferoverløb kan X7-8- og X7-4-direktører potentielt også være i risiko for at "bekræfte" fejlmeddelelser, hvis følgende betingelser er opfyldt i denne rækkefølge:
  • X7-8- eller X7-4-director, der tidligere kørte på FOS v9.0.x
  • Director opgraderes derefter til FOX v9.1.x
  • Directoren har derefter F-porte, der logger ud og logger på, mens version v9.1.x
  • Directoren støder derefter på en overopkrævningshændelse, der kræver administration fra Trafikoptimering
  • Director udfører derefter en HA-fail-over (firmwareopgradering medfører, at der sker en fail-over)
  • Director støder på en anden overadministrationshændelse, der kræver administration fra Trafikoptimering 
X7-8- eller X7-4-direktører, der opfylder alle disse betingelser, i den angivne sekvens, kan være i risiko for at støde på "verificer" fejl under administration af overbeskrivelse fra Trafikoptimering.
  • X7-8- eller X7-4-chefer, der kun nogensinde har kørt på FOS v9.1.x-firmware, er ikke i risiko for at støde på "verificer"-fejlen, da kun v9.1-programmeringsmodellen bruges til alle porte. Gen 7-direktører skal tidligere have kørt med FOS v9.0.x for at være modtagelige for dette problem.
  • X7-8- eller X7-4-chefer, der er blevet koldstartede/slukkede under kørsel på FOS v9.1.x-firmware, er heller ikke i risiko for at støde på "verificer"-fejlen, da alle porte vil bruge v9.1-programmering efter genstart

Symptomer
7. gen. direktører og switche, der er stødt på en overtilmeldingsadministrationshændelse, vil overvåge følgende
Trafikoptimering RASlog:
[TO-1006], 1011618/1002267, FID 128, INFO, Switch_100, strømme med destinationen b1a02 er blevet flyttet til PG_OVER_SUBSCRIPTION_4G_16G PG., cfs_ctrlr.c, linje: 1470, comp:cfsd, ltime:2023/05/17-06:15:33:923058
Yderligere symptomer, der kan forekomme på grund af disse identificerede problemer, kan være:
  • Der kan observeres store antal CRC-fejl på et link, der ikke er løst med udskiftning af optik/kabel
  • Rammer kan kasseres, kreditering på et link kan gå tabt
  • Portene kan være fejlbehæftede, ASIC kan stoppe og være fejlbehæftede
  • En director kan opleve en uventet HA-fail-over eller endda en kold genstart af directoren
  • Switche kan opleve en kold genstart

Cause

Overoptimeringsstyring af trafikoptimeringsfunktionen under særlige forhold kan medføre fejlscenarier
, der påvirker transmission af rammer eller porte, der administreres. I tilfælde af alvorlige overbelastningsscenarier kan disse fejl også
påvirke ydeevnen af andre FOS-dæmoner (Fabric OS), som er aktive på switchen, hvilket fører til time-outs
for software, hvilket resulterer i nedbrud i HA-fejl eller switche.

Gen 7-direktører og -switche (X7-8, X7-4, 7730 og 7720), der støder på overstrøm af rammebuffere under forsøg på
at administrere og omdirigere overtilkomne strømme som følge af en alvorlig overbelastningshændelse, kan forårsage uventede fejl. Hvis
antallet af rammer overskrider bufferen, der bruges til at administrere håndtering af overopskrivning, kan
disse overflødige rammer man gå glip af under trafikoptimeringshåndteringen. Disse overflødige rammer kan muligvis overskrives af andre rammer, der fører
til ramme CRC-fejl eller endda portfejl, hvis overskriftsoplysningerne overskrives. I tilfælde af alvorlige overbelastningsscenarier kan administrationen af disse overløb/overskydende rammer føre til blokering af andre FOS-dæmoner, hvilket kan resultere i
watchdog-timeouts. Kritiske dæmoner, der får timeout til at medføre en ha-failover eller afbrudt switch-genstart.

Ud over den potentielle håndtering af rammeoverløb kunne X7-8- og X7-4-chefer, der tidligere havde kørt på FOS v 9.0.x og derefter senere opgraderet til FOS v9.1.x, støde på kontrolfejl efter HA-fejlovergange (herunder dem, der skyldes firmwareopgraderinger til højere versioner af v9.1.x). Der vil blive observeret flere "verificerings"-fejlmeddelelser under trafikoptimeringsstyringen under trafikoptimering pga. en registreret konflikt i programmering af porte, der er oprettet, når nogle porte, men ikke alle porte, nulstilles, mens v9.1.x. Konflikten mellem overbelastningsstyringsprogrammer på porte, der aldrig blev nulstillet ved v9.0.x og derefter senere fandt overbelastningsstyring, mens v9.1.x på porte, der blev nulstillet, kan forekomme efter en HA-fejlhændelse.

Resolution

Omgå problemet
" Ved risiko"-bestyrelser og switche kan deaktivering af Trafikoptimeringshandlingen for administration af overopskrift.
Udsted følgende CLI-kommando fra vedligeholdelseskontoen for at deaktivere adfærden for håndtering af overabonnementsadministration
i Trafikoptimering
maintenance> serviceexec trafikoptdebug --enableosclassification 0
BEMÆRK: Vedligeholdelseskommandoen skal køres på alle logiske switche i kabinettet.
BEMÆRK: Indstillingen vil være vedvarende på tværs af fail-overs og tænd/sluk-cyklusser

Korrigerende handling
En softwareløsning, der leveres i FOS v9.1.1c, og højere vil forhindre disse fejl. De samme løsninger findes
også i FOS v9.2.0a og højere versioner af FOS v9.2.x. Opgradering til disse versioner af FOS vil forhindre overkørsel af
rammer pga. overadministration og vil også forhindre "verificeringsfejl" på X7-chefer.

For alle Gen 7 director eller switche (X7-8, X7-4, 7730 og 7720), der stadig kører en version af FOS v9.0.x og kan være "i fare"
for at støde på de beskrevne problemer, anbefales det at vente på udgivelsen af FOS v9.1.1c, før du opgraderer.

7. gen. bestyrelsesmedlemmer og switche, der i øjeblikket opererer på en v9.1.x- eller v9.2.0-udgivelser, og som er fast besluttet på at være i farezonen,
bør implementere løsningerne. Deaktivering af trafikoptimeringshandlingen for overoptimering vil forhindre, at
både bufferoverløb og "verificering" af fejl opstår. Efter opgradering til v9.1.1c eller v9.2.0a kan over-abonnementsadministrationshandlingen
genaktiveres via følgende kommando:
Udsted følgende CLI-kommando fra vedligeholdelseskontoen for at genaktivere adfærden for håndtering af overabonnementsadministration i Trafik Optimizer
maintenance> serviceexec trafikoptdebug --enableosclassification 1
BEMÆRK: Vedligeholdelseskommandoen skal køres på alle logiske switche i kabinettet.

Enhver Gen 7 Director eller switch, der allerede har registreret fejlen "bufferoverflow", skal udføre en kold genstart
for at gendanne fra fejltilstanden:
Direktører: Tænd/sluk stikket på de berørte portblade-switche
: Genstart switchen (kold genstart)
Valgmulighed 1: Udfør den genstartshandling, der er vist ovenfor, og implementer derefter omgåelse for at deaktivere administrationshandlingen for overabonnement fra Trafikoptimeringsindstilling
2: Opgrader til en version af FOS med løsningen, og udfør derefter den genstartshandling, der er vist ovenfor.

Opgradering til en version af FOS med den anførte løsning vil forhindre, at fejlen "bufferoverløb" opstår, men
når den fejlende tilstand er fundet, vil kun en kold genstart af ASIC løse fejltilstanden.
Opgradering til en version af FOS med den anførte løsning vil forhindre og automatisk gendanne fra fejltilstanden
"verificer" uden yderligere handling.

Efter opgradering til en version af FOS, der indeholder løsningen, udføres en kontrol af intern hukommelse for at afgøre, om director'en eller switchen tidligere er stødt på fejlen og kræver genstart for at gendanne den fra fejltilstanden.
Følgende RASlog vises, hvis fejltilstanden registreres efter opgradering af FOS til en version med løsningen:
2023/06/01-17:07:50 (GMT), [C5-1057], 5, SLOT 2 | KABINET, KRITISK, Switch_3,S10,C0
: HW ASIC-chip er i en inkonsistent tilstand = 0x1002.
Hvis ovenstående RASlog observeres efter opgraderingen af FOS, har directoren eller switchen tidligere fundet fejlen "bufferoverløb
" før opgraderingen og skal udføre en kold genstart for at gendanne systemet helt fra fejltilstanden:
Direktører: Tænd/sluk stikket på de berørte portblade-switche
: Genstart switchen (kold genstart)

Article Properties


Affected Product

Connectrix DS-7720B, Connectrix DS-7730B, Connectrix ED-DCX7-4B, Connectrix ED-DCX7-8B

Last Published Date

26 Oct 2023

Version

3

Article Type

Solution