Isilon: Para węzłów równorzędnych Gen6 DE (H400, A200, A2000) generuje zdarzenia i komunikaty konsoli wskazujące problemy z łączem NTB po wymianie lub przeniesieniu modułu obliczeniowego

Zusammenfassung: Para węzłów równorzędnych Gen6 DE (H400, A200, A2000) może czasami rozpocząć generowanie komunikatów o błędach wskazujących problemy z ich łączem NTB. Błędy mogą obejmować powtarzane komunikaty "ŁĄCZE NTB w górę/w dół" oraz błędy negocjacji szybkości łącza. ...

Dieser Artikel gilt für Dieser Artikel gilt nicht für Dieser Artikel ist nicht an ein bestimmtes Produkt gebunden. In diesem Artikel werden nicht alle Produktversionen aufgeführt.

Symptome

Para węzłów równorzędnych Gen6 DE (H400, A200, A2000) może czasami rozpocząć generowanie komunikatów o błędach wskazujących problemy z ich łączem NTB. Błędy mogą obejmować powtarzające się komunikaty "link up/down", a także błędy negocjacji szybkości łącza, na przykład:
 
mnv0: HW link down event
mnv0: HW link up event
mnv0: Failed to negotiate PCIe lane speed; expected 3 lane speed, got 2.
mnv0: transport link up
mnv0: peer up


Zamiast tego dzienniki i/lub konsola mogą po prostu wyświetlać łącze NTB jako niewchodzące. Obecnie istnieje wiele możliwych przyczyn tego problemu, z których niektóre są nadal badanych. Jeśli jeden lub oba węzły, których dotyczy problem, zostały niedawno przeniesione do innego gniazda obudowy lub wymieniono ich moduł obliczeniowy, problem i rozwiązanie udokumentowane w tej wiedzy mogą mieć zastosowanie. Ten problem nie wpływa na węzły EP (F800, H600, H500).  

Ursache

Węzły równorzędne komunikują się ze sobą za pośrednictwem specjalnego kanału komunikacyjnego o nazwie NonTransparent Bridge (NTB) wbudowanego w płytę montażową obudowy. W normalnych warunkach pracy oba węzły w parze równorzędnej muszą mieć inną wartość PPD, aby móc komunikować się ze sobą za pośrednictwem bazy danych NTB. Wartości PPD są przypisywane na podstawie identyfikatora gniazda węzła w obudowie. Ten problem jest spowodowany przez system BIOS węzła zachowujący stary identyfikator gniazda węzła, gdy węzeł lub moduł obliczeniowy zostanie zamieniony na inne gniazdo niż pierwotnie pochodzi, zamiast wykryć nowy identyfikator gniazda. Może to spowodować nieprawidłowe ustawienie wartości PPD, co powoduje konflikt, który uniemożliwia węzłom ustanowienie łącza NTB.

Lösung

Uruchom następujące polecenie na obu węzłach w danej parze równorzędnej, aby sprawdzić, czy problem udokumentowany w tej wiedzy ma zastosowanie:
# sysctl dev.ntb_hw.0.debug_info.ppd

Każdy węzeł odpowie:

dev.ntb_hw.0.debug_info.ppd:
73

Albo:
dev.ntb_hw.0.debug_info.ppd: 93

- Jeśli jeden węzeł w parze odpowie 73, a drugi odpowiada 93, problem ten nie dotyczy obecnie węzłów opisanych w tej wiedzy.
Aby uzyskać dalszą pomoc, skontaktuj się z działem pomocy technicznej EMC Isilon.

- Jeśli oba węzły odpowiedzą tym samym numerem, 73 lub 93, problem jest opisany w tej wiedzy. Ten problem został rozwiązany w zaktualizowanym oprogramowaniu wewnętrznym węzła zawartym w pakiecie oprogramowania wewnętrznego węzła 10.1.6 i nowszych, a także w poprawce kodu zawartej w OneFS 8.1.0.4 i nowszych. Choć każda aktualizacja indywidualnie rozwiązuje problem, obie wersje zawierają inne ważne poprawki, dlatego zaleca się zainstalowanie obu.

Betroffene Produkte

Isilon, Isilon Gen6
Artikeleigenschaften
Artikelnummer: 000056963
Artikeltyp: Solution
Zuletzt geändert: 28 Juni 2023
Version:  6
Antworten auf Ihre Fragen erhalten Sie von anderen Dell NutzerInnen
Support Services
Prüfen Sie, ob Ihr Gerät durch Support Services abgedeckt ist.