Isilon: Gen6 DE-nodepar (H400, A200, A2000) genererer hendelser og konsollmeldinger som indikerer problemer med NTB-koblingen etter utskifting eller flytting av en datamodul
Summary: Et gen6 DE-nodepar (H400, A200, A2000) kan noen ganger begynne å generere feilmeldinger som indikerer problemer med NTB-koblingen. Feil kan omfatte gjentatte NTB-koblingsmeldinger og forhandlingsfeil med koblingshastighet. ...
This article applies to
This article does not apply to
This article is not tied to any specific product.
Not all product versions are identified in this article.
Symptoms
Et gen6 DE-nodepar (H400, A200, A2000) kan noen ganger begynne å generere feilmeldinger som indikerer problemer med NTB-koblingen. Feil kan omfatte gjentatte «koblingsopp/ned»-meldinger samt forhandlingsfeil med koblingshastighet, for eksempel:
mnv0: HW link down event mnv0: HW link up event mnv0: Failed to negotiate PCIe lane speed; expected 3 lane speed, got 2. mnv0: transport link up mnv0: peer up
Alternativt kan loggene og/eller konsollen vise NTB-koblingen som nede og ikke komme opp. Det ser for øyeblikket ut til å være flere mulige årsaker til dette problemet, og noen av disse er fortsatt under undersøkelse. Hvis én eller begge de berørte nodene nylig ble flyttet inn i et annet kabinettspor eller fikk byttet ut datamodulen, kan problemet og løsningen som er dokumentert i denne kunnskapsbasen, gjelde. Dette problemet påvirker ikke EP-noder (F800, H600, H500).
Cause
Nodenoder kommuniserer med hverandre via en spesiell kommunikasjonskanal kalt NonTransparent Bridge (NTB) innebygd i kabinettets bakpanel. I normal drift må begge nodene i et nodepar ha en annen PPD-verdi for å kunne kommunisere med hverandre via NTB. PPD-verdier tilordnes basert på nodens spor-ID i kabinettet. Dette problemet skyldes at nodens BIOS beholder nodens gamle spor-ID når en node- eller datamodul byttes inn i et annet spor enn den opprinnelig kom fra, i stedet for å oppdage den nye spor-ID-en. Dette kan føre til at PPD-verdien angis på feil måte, noe som fører til en konflikt som hindrer nodene i å opprette en NTB-kobling.
Resolution
Kjør følgende kommando på begge nodene i det berørte motpartsparet for å kontrollere om problemet som er dokumentert i denne kb-en, er aktuelt:
# sysctl dev.ntb_hw.0.debug_info.ppd
Hver node vil svare med enten:
dev.ntb_hw.0.debug_info.ppd:
73
Eller:
dev.ntb_hw.0.debug_info.ppd: 93
– Hvis én node i et par svarer med 73 og den andre svarer med 93, påvirkes ikke disse nodene av problemet som er dokumentert i denne kb-en.
Kontakt EMC Isilon teknisk støtte for å få mer hjelp.
– Hvis begge nodene svarer med samme nummer, uansett om de er 73 eller 93, påvirkes problemet som er dokumentert i denne kb-en. Dette problemet er løst i oppdatert nodefastvare som er inkludert i nodefastvarepakken 10.1.6 og nyere, samt i en kodeløsning inkludert i OneFS 8.1.0.4 og nyere. Selv om hver oppdatering individuelt vil løse problemet, inneholder begge utgivelsene andre viktige feilrettinger, så det anbefales å installere begge.
# sysctl dev.ntb_hw.0.debug_info.ppd
Hver node vil svare med enten:
dev.ntb_hw.0.debug_info.ppd:
73
Eller:
dev.ntb_hw.0.debug_info.ppd: 93
– Hvis én node i et par svarer med 73 og den andre svarer med 93, påvirkes ikke disse nodene av problemet som er dokumentert i denne kb-en.
Kontakt EMC Isilon teknisk støtte for å få mer hjelp.
– Hvis begge nodene svarer med samme nummer, uansett om de er 73 eller 93, påvirkes problemet som er dokumentert i denne kb-en. Dette problemet er løst i oppdatert nodefastvare som er inkludert i nodefastvarepakken 10.1.6 og nyere, samt i en kodeløsning inkludert i OneFS 8.1.0.4 og nyere. Selv om hver oppdatering individuelt vil løse problemet, inneholder begge utgivelsene andre viktige feilrettinger, så det anbefales å installere begge.
Affected Products
Isilon, Isilon Gen6Article Properties
Article Number: 000056963
Article Type: Solution
Last Modified: 28 Jun 2023
Version: 6
Find answers to your questions from other Dell users
Support Services
Check if your device is covered by Support Services.