Ісілон: Пара однорангових вузлів DE 6-го покоління (H400, A200, A2000) генерує події та консольні повідомлення, що вказують на проблеми з їхнім зв'язком NTB після заміни або переміщення обчислювального модуля

Zusammenfassung: Пара вузлів DE 6-го покоління (H400, A200, A2000) іноді може почати генерувати повідомлення про помилки, що вказують на проблеми з їхнім зв'язком NTB. Помилки можуть включати повторювані повідомлення «NTB link up/down» і помилки узгодження швидкості з'єднання. ...

Dieser Artikel gilt für Dieser Artikel gilt nicht für Dieser Artikel ist nicht an ein bestimmtes Produkt gebunden. In diesem Artikel werden nicht alle Produktversionen aufgeführt.

Symptome

Пара однорангових вузлів Gen6 DE (H400, A200, A2000) іноді може почати генерувати повідомлення про помилки, що вказують на проблеми з їхнім зв'язком NTB. Помилки можуть включати повторювані повідомлення «вгору/вниз посилання», а також помилки узгодження швидкості з'єднання, наприклад:
 
mnv0: HW link down event
mnv0: HW link up event
mnv0: Failed to negotiate PCIe lane speed; expected 3 lane speed, got 2.
mnv0: transport link up
mnv0: peer up


Крім того, журнали та/або консоль можуть просто показувати посилання NTB як опущене і не з'являється. Наразі, схоже, існує кілька можливих причин цієї проблеми, деякі з яких все ще досліджуються. Якщо один або обидва уражені вузли нещодавно було переміщено в інший слот шасі або замінено обчислювальний модуль, може застосовуватися проблема та її вирішення, задокументовані в цій базі знань. Ця проблема не стосується вузлів EP (F800, H600, H500).  

Ursache

Однорангові вузли зв'язуються один з одним через спеціальний канал зв'язку, званий NonTransparent Bridge (NTB), вбудований в об'єднувальну плату шасі. У нормальній роботі обидва вузли в одноранговій парі повинні мати різне значення PPD, щоб мати можливість спілкуватися один з одним через NTB. Значення PPD присвоюються на основі ідентифікатора слота вузла в шасі. Ця проблема пов'язана з тим, що BIOS вузла зберігає старий ідентифікатор слота вузла, коли вузол або обчислювальний модуль замінюється на інший слот, ніж він прийшов спочатку, а не виявляє новий ідентифікатор слота. Це може призвести до неправильного встановлення значення PPD, що спричиняє конфлікт, який не дозволяє вузлам встановити зв'язок NTB.

Lösung

Запустіть наступну команду на обох вузлах у відповідній парі вузлів, щоб перевірити, чи застосовна проблема,

задокументована в цій базі знань:# sysctl dev.ntb_hw.0.debug_info.ppd Кожен вузол відповість або: dev.ntb_hw.0.debug_info.ppd

:

73

Або:dev.ntb_hw.0.debug_info.ppd:
93

- Якщо один вузол у парі відповідає 73, а інший – 93, на ці вузли наразі не впливає проблема, задокументована в цій базі знань.
Будь ласка, зв'яжіться з технічною підтримкою EMC Isilon для отримання додаткової допомоги.

- Якщо обидва вузли відповідають однаковим номером (73 або 93), на них впливає проблема, задокументована в цій базі знань. Цю проблему вирішено в оновленій мікропрограмі вузла, що входить до пакета мікропрограми вузла 10.1.6 і пізніших версій, а також у виправленні коду, включеному в OneFS 8.1.0.4 і пізніших версіях. Хоча кожне оновлення окремо вирішує проблему, обидва випуски містять інші важливі виправлення, тому рекомендується інсталювати обидва.

Betroffene Produkte

Isilon, Isilon Gen6
Artikeleigenschaften
Artikelnummer: 000056963
Artikeltyp: Solution
Zuletzt geändert: 28 Juni 2023
Version:  6
Antworten auf Ihre Fragen erhalten Sie von anderen Dell NutzerInnen
Support Services
Prüfen Sie, ob Ihr Gerät durch Support Services abgedeckt ist.