Isilon: Gen6 DE-nodepar (H400, A200, A2000) genererer hendelser og konsollmeldinger som indikerer problemer med NTB-koblingen etter utskifting eller flytting av en datamodul

Summary: Et gen6 DE-nodepar (H400, A200, A2000) kan noen ganger begynne å generere feilmeldinger som indikerer problemer med NTB-koblingen. Feil kan omfatte gjentatte NTB-koblingsmeldinger og forhandlingsfeil med koblingshastighet. ...

This article applies to This article does not apply to This article is not tied to any specific product. Not all product versions are identified in this article.

Symptoms

Et gen6 DE-nodepar (H400, A200, A2000) kan noen ganger begynne å generere feilmeldinger som indikerer problemer med NTB-koblingen. Feil kan omfatte gjentatte «koblingsopp/ned»-meldinger samt forhandlingsfeil med koblingshastighet, for eksempel:
 
mnv0: HW link down event
mnv0: HW link up event
mnv0: Failed to negotiate PCIe lane speed; expected 3 lane speed, got 2.
mnv0: transport link up
mnv0: peer up


Alternativt kan loggene og/eller konsollen vise NTB-koblingen som nede og ikke komme opp. Det ser for øyeblikket ut til å være flere mulige årsaker til dette problemet, og noen av disse er fortsatt under undersøkelse. Hvis én eller begge de berørte nodene nylig ble flyttet inn i et annet kabinettspor eller fikk byttet ut datamodulen, kan problemet og løsningen som er dokumentert i denne kunnskapsbasen, gjelde. Dette problemet påvirker ikke EP-noder (F800, H600, H500).  

Cause

Nodenoder kommuniserer med hverandre via en spesiell kommunikasjonskanal kalt NonTransparent Bridge (NTB) innebygd i kabinettets bakpanel. I normal drift må begge nodene i et nodepar ha en annen PPD-verdi for å kunne kommunisere med hverandre via NTB. PPD-verdier tilordnes basert på nodens spor-ID i kabinettet. Dette problemet skyldes at nodens BIOS beholder nodens gamle spor-ID når en node- eller datamodul byttes inn i et annet spor enn den opprinnelig kom fra, i stedet for å oppdage den nye spor-ID-en. Dette kan føre til at PPD-verdien angis på feil måte, noe som fører til en konflikt som hindrer nodene i å opprette en NTB-kobling.

Resolution

Kjør følgende kommando på begge nodene i det berørte motpartsparet for å kontrollere om problemet som er dokumentert i denne kb-en, er aktuelt:
# sysctl dev.ntb_hw.0.debug_info.ppd

Hver node vil svare med enten:

dev.ntb_hw.0.debug_info.ppd:
73

Eller:
dev.ntb_hw.0.debug_info.ppd: 93

– Hvis én node i et par svarer med 73 og den andre svarer med 93, påvirkes ikke disse nodene av problemet som er dokumentert i denne kb-en.
Kontakt EMC Isilon teknisk støtte for å få mer hjelp.

– Hvis begge nodene svarer med samme nummer, uansett om de er 73 eller 93, påvirkes problemet som er dokumentert i denne kb-en. Dette problemet er løst i oppdatert nodefastvare som er inkludert i nodefastvarepakken 10.1.6 og nyere, samt i en kodeløsning inkludert i OneFS 8.1.0.4 og nyere. Selv om hver oppdatering individuelt vil løse problemet, inneholder begge utgivelsene andre viktige feilrettinger, så det anbefales å installere begge.

Affected Products

Isilon, Isilon Gen6
Article Properties
Article Number: 000056963
Article Type: Solution
Last Modified: 28 Jun 2023
Version:  6
Find answers to your questions from other Dell users
Support Services
Check if your device is covered by Support Services.