Isilon. Пара одноранговых узлов DE 6-го поколения (H400, A200, A2000) генерирует события и сообщения консоли, указывающие на проблемы с их NTB-каналом после замены или перемещения вычислительного модуля

Zusammenfassung: Пара одноранговых узлов DE 6-го поколения (H400, A200, A2000) иногда начинает генерировать сообщения об ошибках, указывающие на проблемы с их каналом NTB. Ошибки могут включать повторяющееся сообщение «NTB link up/down» и ошибки согласования скорости канала. ...

Dieser Artikel gilt für Dieser Artikel gilt nicht für Dieser Artikel ist nicht an ein bestimmtes Produkt gebunden. In diesem Artikel werden nicht alle Produktversionen aufgeführt.

Symptome

Пара одноранговых узлов DE 6-го поколения (H400, A200, A2000) иногда начинает генерировать сообщения об ошибках, указывающие на проблемы с их каналом NTB. Ошибки могут включать повторяющееся сообщение «link up/down», а также ошибки согласования скорости канала, например:
 
mnv0: HW link down event
mnv0: HW link up event
mnv0: Failed to negotiate PCIe lane speed; expected 3 lane speed, got 2.
mnv0: transport link up
mnv0: peer up


Кроме того, журналы и/или консоль могут просто показывать, что канал NTB отключен и не отображается. В настоящее время существует несколько возможных причин этой проблемы, некоторые из которых еще находятся на проверке. Если один или оба затронутых узла недавно были перемещены в другой слот шасси или их вычислительный модуль был заменен, проблема и решение, описанные в этой статье базы знаний, могут применяться. Эта проблема не затрагивает узлы EP (F800, H600, H500).  

Ursache

Одноранговые узлы обмениваются данными друг с другом через специальный канал связи, который называется «Непарный мост » (NTB), встроенный в распределительную плату шасси. При нормальной работе оба узла в одноранговой паре должны иметь другое значение PPD, чтобы иметь возможность обмениваться данными друг с другом через NTB. Значения PPD назначаются на основе идентификатора слота узла в шасси. Эта проблема вызвана тем, что BIOS узла сохраняет старый идентификатор слота узла, когда узел или вычислительный модуль заменяется в другой слот, отличный от исходного, вместо обнаружения нового идентификатора слота. Это может привести к неправильной установке значения PPD, что приводит к конфликту, который не позволяет узлам установить канал NTB.

Lösung

Выполните следующую команду наобоих узлах затронутой пары одноранговых узлов, чтобы проверить, применима ли проблема, описанная в данной статье базы знаний:
# sysctl dev.ntb_hw.0.debug_info.ppd

Каждый узел будет отвечать с помощью команды:

dev.ntb_hw.0.debug_info.ppd:
73

Или:
dev.ntb_hw.0.debug_info.ppd: 93

- Если один узел в паре отвечает с 73, а другой — с 93, эти узлы в настоящее время не подвержены проблеме, описанной в этой статье базы знаний.
Для получения дополнительной помощи обратитесь в службу технической поддержки EMC Isilon.

- Если оба узла отвечают с одинаковым номером (73 или 93), они подвержены проблеме, описанной в этой статье базы знаний. Эта проблема устранена в обновленной микропрограмме узла, включенной в node Firmware Package 10.1.6 и более поздних версий, а также в исправлении кода, включенного в OneFS 8.1.0.4 и более поздние версии. Хотя каждое обновление по отдельности устраняет проблему, оба выпуска содержат другие важные исправления, поэтому рекомендуется установить и то, и другое.

Betroffene Produkte

Isilon, Isilon Gen6
Artikeleigenschaften
Artikelnummer: 000056963
Artikeltyp: Solution
Zuletzt geändert: 28 Juni 2023
Version:  6
Antworten auf Ihre Fragen erhalten Sie von anderen Dell NutzerInnen
Support Services
Prüfen Sie, ob Ihr Gerät durch Support Services abgedeckt ist.