Connectrix: Cisco MDS9700 DS-X9448-768K9: Linkfout Link resetten mislukt Nonempty RECV-wachtrijfouten opgetreden na poortfout
Summary: Cisco MDS9700 DS-X9448-768K9: Linkfout Link resetten mislukt Niet-lege RECV-wachtrijfouten die worden weergegeven na poort-hwfailure.
Symptoms
- Poorten 9-12 op de tweede ASIC van een LC mislukt met hwfailure-fouten. Poorten fc13-16 (ook op dezelfde ASIC) dropten pakketten die congestie op de switch veroorzaakten, maar deze poorten (13-16) werden niet als defect weergegeven.
- De getroffen lijnkaart is een 48-poorts 16 Gbps Advanced FC-module (DS-X9448-768K9)
Cause
Dit probleem wordt veroorzaakt door het volgende probleem:
CSCuw59045> MDS9700 DS-X9448-768K9 - xbar synchronisatieverlies moet alle acht poorten doen mislukken.
Symptoom:
Na een interne hardwarefout treedt framebeschadiging of -dalingen op, of beide, op een blok van vier poorten. Het volgende syslog-bericht geeft de hardwarefout aan:
Voorbeeld van een hardwarefout met poort-ASIC/Fabric Link:
MODULE-4-MOD_WARNING: Module 4 (Serial number: JAE180605XF) reported warning fc4/9-12due to SAC sync lost in device DEV_LOCAL_SAC_ASIC (device error 0xc9101200) CALLHOME-2-EVENT: MODULE_WARNING MODULE-2-MOD_SOMEPORTS_FAILED: Module 4 (Serial number: JAE180605XF) reported failure on ports fc4/9-12 (Fibre Channel) due to Local serial link syncing exception in device DEV_LOCAL_SAC_ASIC (device error 0xc9101204)
De volgende fouten bij het falen van de poorthardware worden geregistreerd:
PORT-5-IF_DOWN_HW_FAILURE: %$VSAN 101%$ Interface fc4/12 is down (Hardware Failure) vmax CALLHOME-2-EVENT: PORT_FAILURE PORT-5-IF_DOWN_HW_FAILURE: %$VSAN 101%$ Interface fc4/11 is down (Hardware Failure) server1 PORT-5-IF_DOWN_HW_FAILURE: %$VSAN 101%$ Interface fc4/10 is down (Hardware Failure) server2 PORT-5-IF_DOWN_HW_FAILURE: %$VSAN 1%$ Interface fc4/9 is down (Hardware Failure) ISL
Wanneer deze fout optreedt, worden slechts vier poorten in plaats van alle acht poorten voor de getroffen poort ASIC door NX-OS ingesteld op de status 'hwFailure'. De overige vier getroffen poorten blijven ingeschakeld, maar gedragen zich als slow-drainpoorten. Wanneer dit gebeurt, worden de volgende tellers verhoogd:
fc1/5 |F16_TMM_TOLB_TIMEOUT_DROP_CNT |13025 |01/01/16
Andere symptomen zijn onder meer het resetten van koppelingen en het resetten van koppelingen op niet-gerelateerde interfaces. Deze fouten worden veroorzaakt door het verkeer dat bestemd is voor de vier poorten die niet zijn uitgeschakeld.
PORT-5-IF_DOWN_LINK_FAILURE: %$VSAN 101%$ Interface fc8/47 is down (Link failure Link Reset failed nonempty recv queue) server3 VSAN 101%$ Interface fc8/32 is down (Link failure Link Reset failed nonempty recv queue) server4
Voorwaarden:
Dit probleem doet zich alleen voor op de MDS 9700 DS-X9448-768K9 lijnkaart na een interne fabric-koppelingsfout.
Resolution
- Controleer of slechts vier van de acht poorten op de ASIC een hwfailure weergeven
- Controleer of de foutmeldingen Link Reset failed nonempty recv queue worden gestreamd voor andere interfaces. Deze poortfouten zijn een symptoom van overbelasting in de switch en niet de hoofdoorzaak
Tijdelijke oplossing:
Stap 1 - Sluit de resterende vier poorten op de defecte ASIC handmatig af om dataverlies of beschadiging te voorkomen.
Gen 5-poortgroeperingen: (x is het betreffende LC-slotnummer)
FCX/1-8
FCX/9-16
FCX/17-24
FCX/25-32
FCX/33-40
FCX/41-48
Stap 2 - Vervang de betreffende lijnkaart.
Additional Information
Bekende beïnvloede releases:
- 6.2(1)
- 6.2(11)
- 6.2(11 bis)
- 6.2(11b)
- 6.2(11 quater)
- 6,2 (11d)
- 6.2(13)
- 6.2(13 bis)
- 6.2(3)
- 6.2(5)
- 6.2(7)
- 6.2(9)
- 6.2(9a)
- 6.2(9b)
- 6.2(9c)
Neem contact op met Dell Support voor een preventieve oplossing voor het probleem.