Connectrix: Slik feilsøker du Fibre Channel-node for å bytte port eller SFP-kommunikasjonsproblemer ved å eliminere selvhjelp.

Summary: Denne artikkelen forklarer hvordan du feilsøker problemer med fiberkanalnode for å bytte port eller SFP-kommunikasjon ved eliminering.

This article applies to This article does not apply to This article is not tied to any specific product. Not all product versions are identified in this article.

Symptoms

Hvordan feilsøke Fibre Channel-noden for å bytte port eller SFP-kommunikasjonsproblemer ved eliminering?

For mange proaktive SFP-erstatninger Koblingsfeil

G-port
Ingen lampe
Ikke i drift (NOS)
Sekvens utenfor linje (OLS)
Tap av signal
med defekt SFP
Feilsøk FC-port
Feil på FC-port

Cause

For mange SFP erstattes proaktivt mens problemet ligger utenfor SFP eller bryteren.

Resolution

Slik løser du dette problemet:

  1. Identifiser noden og svitsjporten som er involvert i kommunikasjonsfeilen.
  2. Kontroller at svitsjporten er administrativt oppe (opphevet, ikke avsluttet) eller aktivert.
  3. Kontroller at det er overflødige baner tilgjengelig for den tilkoblede enheten før du fortsetter.

 

ADVARSEL: Før du fortsetter, må du sørge for at du vet hvordan noden din reagerer hvis den får en ny FCID. Noen operativsystemversjoner av AIX og HP-UX reagerer ikke godt på slike endringer, siden FCID er innebygd i maskinvarebanen til lagringsenheten. Hvis du flytter kabelen, kan det hende at data ikke er tilgjengelige. Hvis du er i tvil, bør du ta kontakt med en EMC-tekniker.

 

  1. Gjør følgende for å eliminere at SFP er problemet:
MERK:  Hvis det er et problem med SFP, er denne prosedyren den raskeste måten å bringe enheten tilbake på nettet.

 

  1. Se etter den ledige porten på svitsjen.
  2. Deaktiver den identifiserte gratisporten på svitsjen.
  3. Flytt kabelen fra porten som skal undersøkes, til den nye deaktiverte friporten i forrige trinn.
  4. Endre den deaktiverte porten for å aktivere tilstand (eller administrativt opp), og koble enheten til nettet igjen.
  5. Fjern/tilbakestill statistikken/tellerne til null på svitsjen.

For Brocade, se KBA: 

Brocade i Connectrix B-serien: Slik sletter du grensesnitt og ASIC-tellere på svitsjer og -direktører i Connectrix Brocade B-serien 

For Cisco se KBA: 

Connectrix - MDS-serien Cisco: Slik sletter du grensesnitt og ASIC-tellere på en MDS

 

  1. Overvåk porten med de respektive kommandoene i 4–6 timer.

 

RESULTATER:

  • Hvis feiltellerne øker, ligger problemet utenfor svitsjen, og kunde/bruker/SAN-admin må rådes til å:

 

    • Den nye porten SFP og kabelen må rengjøres. (For å forhindre forurensning på SFP av en skitten kabel, bør du vurdere å bruke et profesjonelt rengjøringssett.)
    • Den tilkoblede enheten må undersøkes nærmere av hvem som støtter enheten.
    • På Cisco-svitsjen, hvis tilstanden "feildeaktivert" kommer tilbake uten tellerøkning, må en SR åpnes for videre baksideundersøkelse.

 

  • Hvis feilene ikke øker (eller tilstanden Feildeaktivert på Cisco-svitsjen ikke kommer tilbake), er SFP-en på den forrige porten defekt, hev SR for SFP-erstatning som gir analyseresultatene ovenfor, inkludert loggutgangene, SFP-detaljer (SM eller MM, og hastighet, så videre)

 

MERK: Du kan gjøre samme fremgangsmåte fra trinn 6 og utover hvis du byttet ut kabelen og/eller den tilkoblede enheten, ved å kontrollere tellerne.

 

Additional Information

MERK: Mesteparten av tiden, hvis en optisk SFP-transceiver definitivt mislykkes, ser du en klar optisk feil i hendelsesloggen.


Maskinvarefeil kan enkelt isoleres ved å bruke en enkel algoritme på problemet; Hvis det ikke er dette stykke maskinvare, så er det den andre brikken. Sløyfe til du har isolert feilen som peker til problemmaskinvaren.


BROCADE EKSEMPLER:

MERK: Hvis du vil ha en forklaring eller beskrivelse av tellerne i porterrshowet, kan du se artikkelen i kunnskapsbasen for selvhjelp (KBA): (Eksemplene uthevet nedenfor.)
Connectrix B-serien: Slik tolker du Brocade-porterrshow-utdataene, og dette betyr tellerne. Selvhjelp



Eksempel 1 ENC OUT med LINK FAIL og LOSS SYNC:

 

porterrshow        :
CURRENT CONTEXT -- 3 , 111
     frames        enc  crc  crc    too   too   bad  enc   disc  link  loss  loss  frjt  fbsy  c3timeout    pcs
     tx     rx     in   err  g_eof  shrt  long  eof  out   c3    fail  sync  sig               tx    rx     err
xx:  849.1k 493.2k 0    0    0      0     0     0    2.3m  0     4     6     0     0     0     0      0     0


Generell årsak:
Bare gyldig, hvis portstatistikk er slettet i løpet av de siste 24 timene. Ellers klassifisere disse tellerne som historiske. Fjern portstatistikk (som oppført ovenfor under punkt 9) og sjekk tellerne og ta data på nytt etter 4-6 timer.

Fra feilene, kan vi se koblingen mislykkes og tap av sync PLUS enc ut feil, disse kan også inkludere tap sig feil.
Disse kombinasjonene av feil indikerer vanligvis en omstart av verten eller en ekstern tilbakestilling av koblingen til svitsjen. Enc out-feilene forårsakes under hastighetsforhandlingen som en del av en koblingsinitialisering.

Forventede handlinger:
Kontroller at enheten som er koblet til porten, hadde en legitim grunn til å koble fra og eller på nettet. For eksempel omstart av vert. Hvis ikke, hev en SR.


Eksempel 2 ENC OUT:

porterrshow        :
CURRENT CONTEXT -- 3 , 111
     frames        enc  crc  crc    too   too   bad  enc   disc  link  loss  loss  frjt  fbsy  c3timeout    pcs
     tx     rx     in   err  g_eof  shrt  long  eof  out   c3    fail  sync  sig               tx    rx     err
xx:  849.1k 493.2k 0    0    0      0     0     0    2.3m  0     0     0     0     0     0     0      0     0


Generell årsak:
Bare gyldig, hvis portstatistikk er slettet i løpet av de siste 24 timene. Ellers klassifisere disse tellerne som historiske. Fjern portstatistikk (som oppført ovenfor under punkt 9) og sjekk tellerne og ta data på nytt etter 4-6 timer.

Enc out-feil uten tilknyttede feil indikerer skitten kabel.

Forventede handlinger:
Kontroller og rengjør alle optiske sider på kabelen og SFP som er koblet til denne porten og tilkoblede enheter.


Eksempel 3 CRC og CRC G_EOF:

porterrshow        :
CURRENT CONTEXT -- 3 , 111
     frames        enc  crc  crc    too   too   bad  enc   disc  link  loss  loss  frjt  fbsy  c3timeout    pcs
     tx     rx     in   err  g_eof  shrt  long  eof  out   c3    fail  sync  sig               tx    rx     err
xx:  849.1k 493.2k 0    1.2k 1.2k   0     0     0    0     0     0     0     0     0     0     0      0     0


Generell årsak:
Bare gyldig, hvis portstatistikk er slettet i løpet av de siste 24 timene. Ellers klassifisere disse tellerne som historiske. Fjern portstatistikk (som oppført ovenfor under punkt 9) og sjekk tellerne og ta data på nytt etter 4-6 timer.

Rammen går inn i bryterporten med en dårlig CRC, men med enden av rammen fortsatt merket som god.
Dette er en indikasjon på at dette er den første porten som registrerer den dårlige rammen, så problemet er enten SFP / kabel / tilkoblet enhetsgrensesnitt på denne spesifikke porten.

Forventede handlinger:
Se standardhandling i oppløsningen.

For en ISL-port må du fjerne statistikken (som oppført ovenfor under punkt 9) og sjekke tellerne og ta data på nytt etter 4–6 timer, samle inn supportsave-filer fra begge svitsjene og åpne SR for normal feilsøking.

 

Eksempel 4 CRC:

porterrshow        :
CURRENT CONTEXT -- 3 , 111
     frames        enc  crc  crc    too   too   bad  enc   disc  link  loss  loss  frjt  fbsy  c3timeout    pcs
     tx     rx     in   err  g_eof  shrt  long  eof  out   c3    fail  sync  sig               tx    rx     err
xx:  849.1k 493.2k 0    1.2k 0      0     0     0    0     0     0     0     0     0     0     0      0     0


Generell årsak:
Bare gyldig, hvis portstatistikk er slettet i løpet av de siste 24 timene. Ellers klassifisere disse tellerne som historiske. Fjern portstatistikk (som oppført ovenfor under punkt 9) og sjekk tellerne og ta data på nytt etter 4-6 timer.

Porten registrerer en ramme som kommer inn i bryteren med en dårlig CRC-ramme, men med rammen allerede merket som dårlig. Vanligvis se dette på en ISL og NPIV F-porter.

Forventede handlinger:
Hvis CRC-feil logger på NPIV-porten, må enheten undersøkes ved å opprettholde leverandøren!
For en ISL-port må du kontrollere alle portene i strukturen for eventuelle CRC-g_oef og handlinger som i eksempel 3.


Eksempel 5 PCS ERR med LINK FAIL og LOSS SYNC:

porterrshow        :
CURRENT CONTEXT -- 3 , 111
     frames        enc  crc  crc    too   too   bad  enc   disc  link  loss  loss  frjt  fbsy  c3timeout    pcs
     tx     rx     in   err  g_eof  shrt  long  eof  out   c3    fail  sync  sig               tx    rx     err
xx:  849.1k 493.2k 0    0    0      0     0     0    0     0     4     4     0     0     0     0      0     466


Generell årsak:
Bare gyldig, hvis portstatistikk er slettet i løpet av de siste 24 timene. Ellers klassifisere disse tellerne som historiske. Fjern portstatistikk (som oppført ovenfor under punkt 9) og sjekk tellerne og ta data på nytt etter 4-6 timer.

Dette gjelder bare på plattformer som støtter porter på 10 Gbps eller 16 Gbps og høyere (6505/6510/6520/DCX-8510), og det ble introdusert med Condor3 ASIC, GEN5-plattformen.

ER_PCS_BLK viser antall PCS-blokkfeil (Physical Coding Sublayer). Denne telleren tilsvarer enc_out for 8 GB / 4 GB kobling, og den brukes bare for 10 GB og 16 GB hastighet og høyere.
Fra feilene, kan vi se koblingen mislykkes og tap av sync pluss stk feile feil, disse kan også inkludere tap sig feil.
Disse kombinasjonene av feil indikerer vanligvis en omstart av verten eller en ekstern tilbakestilling av koblingen til svitsjen.
PC-ens feilfeil oppstår under hastighetsforhandlingen som en del av koblingsinitialisering.

Forventede handlinger:
Kontroller at enheten som er koblet til porten, hadde en legitim grunn til å koble fra og eller på nettet. For eksempel omstart av vert. Hvis ikke, hev SR.


Eksempel 6 PCS ERR:

porterrshow        :
CURRENT CONTEXT -- 3 , 111
     frames        enc  crc  crc    too   too   bad  enc   disc  link  loss  loss  frjt  fbsy  c3timeout    pcs
     tx     rx     in   err  g_eof  shrt  long  eof  out   c3    fail  sync  sig               tx    rx     err
xx:  849.1k 493.2k 0    0    0      0     0     0    0     0     0     0     0     0     0     0      0     466


Generell årsak:
Bare gyldig, hvis portstatistikk er slettet i løpet av de siste 24 timene. Ellers klassifisere disse tellerne som historiske. Fjern portstatistikk (som oppført ovenfor under punkt 9) og sjekk tellerne og ta data på nytt etter 4-6 timer.

PCS ERR-feil uten tilknyttede feil indikerer skitten kabel.

Forventede handlinger:
Kontroller og rengjør alle optiske sider på kabelen og SFP som er koblet til denne porten og tilkoblede enheter.

 


CISCO EXAMPLES:

Eksempel 1 Feildeaktivert:

Feildeaktivert - økning av ingen grensesnittfeil
 

fc1/1 is down (Error disabled - bit error rate too high)
    Hardware is Fibre Channel, SFP is short wave laser w/o OFC (SN).
    5 minutes input rate 0 bits/sec, 0 bytes/sec, 0 frames/sec
    5 minutes output rate 0 bits/sec, 0 bytes/sec, 0 frames/sec
      179 frames input, 7668 bytes
        0 discards, 0 errors
        0 CRC,  0 unknown class
        0 too long, 0 too short
      23 frames output, 1320 bytes
        0 discards, 0 errors
      1 input OLS, 1 LRR, 0 NOS, 1 loop inits
      2 output OLS, 0 LRR, 0 NOS, 1 loop inits
    Interface last changed at Thu Jun  5 01:51:00 2014

 

Generell grunn:
Den "Errdisabled" tilstand av et grensesnitt kan være litt misvisende som grensesnitt tellere kan være rent på frontenden og bryteren ser ut til å ned porten med "feildeaktivert" tilstand, og feil tellere øker på baksiden end (ASIC / intern / linecard).

Forventede handlinger:
Se standardhandling i oppløsningen. Hvis det skjer på nytt, samler du inn teknisk støtteinformasjon og åpner SR.
 

MERK: Informasjon om tilstanden "Feildeaktivert" fra Cisco: Bitfeilene kan oppstå av følgende årsaker:
  • Defekt eller dårlig kabel
  • Feil eller dårlig SFP
  • SFP er spesifisert til å operere ved 1 Gbps, men brukes ved 2 Gbps.
  • SFP er spesifisert for å operere ved 2 Gbps, men brukes ved 4 Gbps.
  • Kortdistansekabel brukes til langtransport, eller langtransportkabel brukes til korttransport.
  • Midlertidig synkroniseringstap
  • Løs kabeltilkobling i én eller begge ender
  • Feil SFP-tilkobling i en eller begge ender


Det oppdages en terskel for bitfeilfrekvens når det oppstår 15 feilbrudd i løpet av en periode på 5 minutter. Bryteren deaktiverer grensesnittet som standard når terskelen er nådd. Du kan skrive inn kommandoene nedenfor i rekkefølge for å aktivere grensesnittet på nytt.

shutdown
no shutdown
Du kan konfigurere svitsjen til ikke å deaktivere et grensesnitt når terskelen krysses.


Grensesnittet deaktiveres som standard.


Eksempel 2:   CRC

CRC-er øker
 

fc13/1 is down (Initializing)
    Port description is ***
    Hardware is Fibre Channel, SFP is long wave laser cost reduced.
    5 minutes input rate 32 bits/sec, 4 bytes/sec, 0 frames/sec
    5 minutes output rate 32 bits/sec, 4 bytes/sec, 0 frames/sec
      162 frames input, 6136 bytes
        0 discards, 17 errors
        17 CRC,  0 unknown class
        0 too long, 17 too short
      74 frames output, 6304 bytes
        2 discards, 0 errors
      108 input OLS, 54 LRR, 2 NOS, 0 loop inits
      83 output OLS, 26 LRR, 56 NOS, 0 loop inits
    Interface last changed at Tue May 27 08:37:20 2014


Generell grunn:

Porten registrerer en ramme som kommer inn i bryteren med en dårlig CRC, men en god ende av rammen. CRC-telleren øker bare på den spesifikke inngangsporten som logger feilen, og eventuelle undersøkelser skal gjøres på denne fysiske koblingen.

Forventede handlinger:
Se standardhandling i oppløsningen.

Fjern portstatistikk (som oppført ovenfor under punkt 9) og sjekk tellerne og ta data på nytt etter 4-6 timer.

 

Eksempel 3: NOS

Sekvens utenom drift (NOS)

show int fc1/1 counters
fc1/1
    5 minutes input rate 1753296 bits/sec, 219162 bytes/sec, 199 frames/sec
    5 minutes output rate 2310384 bits/sec, 288798 bytes/sec, 194 frames/sec
    2741512190 frames input, 2542476084276 bytes
      0 class-2 frames, 0 bytes
      2741512190 class-3 frames, 2542476084276 bytes
      0 class-f frames, 0 bytes
      0 discards, 0 errors, 0 CRC
      0 unknown class, 0 too long, 0 too short
    3410405365 frames output, 5164364339412 bytes
      0 class-2 frames, 0 bytes
      3410405365 class-3 frames, 5164364339412 bytes
      0 class-f frames, 0 bytes
      0 discards, 0 errors
    1 input OLS, 1 LRR, 0 NOS, 307 loop inits
    289 output OLS, 289 LRR, 289 NOS, 289 loop inits
    0 link failures, 0 sync losses, 0 signal losses
     48276 BB credit transitions from zero
      16 receive B2B credit remaining
      3 transmit B2B credit remaining
      3 low priority transmit B2B credit remaining

 

Generell grunn:

Tap av forbindelse før koblingsforhandlinger.


Forventede handlinger:
Kontroller lag 1 (fysisk lag) og kildeenheten.

Affected Products

Connectrix

Products

Connectrix, Connectrix B-Series Hardware, Connectrix MDS-Series Hardware
Article Properties
Article Number: 000028863
Article Type: Solution
Last Modified: 29 Jul 2025
Version:  9
Find answers to your questions from other Dell users
Support Services
Check if your device is covered by Support Services.