Isilon. Пара одноранговых узлов DE 6-го поколения (H400, A200, A2000) генерирует события и сообщения консоли, указывающие на проблемы с их NTB-каналом после замены или перемещения вычислительного модуля
Summary: Пара одноранговых узлов DE 6-го поколения (H400, A200, A2000) иногда начинает генерировать сообщения об ошибках, указывающие на проблемы с их каналом NTB. Ошибки могут включать повторяющееся сообщение «NTB link up/down» и ошибки согласования скорости канала. ...
This article applies to
This article does not apply to
This article is not tied to any specific product.
Not all product versions are identified in this article.
Symptoms
Пара одноранговых узлов DE 6-го поколения (H400, A200, A2000) иногда начинает генерировать сообщения об ошибках, указывающие на проблемы с их каналом NTB. Ошибки могут включать повторяющееся сообщение «link up/down», а также ошибки согласования скорости канала, например:
mnv0: HW link down event mnv0: HW link up event mnv0: Failed to negotiate PCIe lane speed; expected 3 lane speed, got 2. mnv0: transport link up mnv0: peer up
Кроме того, журналы и/или консоль могут просто показывать, что канал NTB отключен и не отображается. В настоящее время существует несколько возможных причин этой проблемы, некоторые из которых еще находятся на проверке. Если один или оба затронутых узла недавно были перемещены в другой слот шасси или их вычислительный модуль был заменен, проблема и решение, описанные в этой статье базы знаний, могут применяться. Эта проблема не затрагивает узлы EP (F800, H600, H500).
Cause
Одноранговые узлы обмениваются данными друг с другом через специальный канал связи, который называется «Непарный мост » (NTB), встроенный в распределительную плату шасси. При нормальной работе оба узла в одноранговой паре должны иметь другое значение PPD, чтобы иметь возможность обмениваться данными друг с другом через NTB. Значения PPD назначаются на основе идентификатора слота узла в шасси. Эта проблема вызвана тем, что BIOS узла сохраняет старый идентификатор слота узла, когда узел или вычислительный модуль заменяется в другой слот, отличный от исходного, вместо обнаружения нового идентификатора слота. Это может привести к неправильной установке значения PPD, что приводит к конфликту, который не позволяет узлам установить канал NTB.
Resolution
Выполните следующую команду наобоих узлах затронутой пары одноранговых узлов, чтобы проверить, применима ли проблема, описанная в данной статье базы знаний:
# sysctl dev.ntb_hw.0.debug_info.ppd
Каждый узел будет отвечать с помощью команды:
dev.ntb_hw.0.debug_info.ppd:
73
Или:
dev.ntb_hw.0.debug_info.ppd: 93
- Если один узел в паре отвечает с 73, а другой — с 93, эти узлы в настоящее время не подвержены проблеме, описанной в этой статье базы знаний.
Для получения дополнительной помощи обратитесь в службу технической поддержки EMC Isilon.
- Если оба узла отвечают с одинаковым номером (73 или 93), они подвержены проблеме, описанной в этой статье базы знаний. Эта проблема устранена в обновленной микропрограмме узла, включенной в node Firmware Package 10.1.6 и более поздних версий, а также в исправлении кода, включенного в OneFS 8.1.0.4 и более поздние версии. Хотя каждое обновление по отдельности устраняет проблему, оба выпуска содержат другие важные исправления, поэтому рекомендуется установить и то, и другое.
# sysctl dev.ntb_hw.0.debug_info.ppd
Каждый узел будет отвечать с помощью команды:
dev.ntb_hw.0.debug_info.ppd:
73
Или:
dev.ntb_hw.0.debug_info.ppd: 93
- Если один узел в паре отвечает с 73, а другой — с 93, эти узлы в настоящее время не подвержены проблеме, описанной в этой статье базы знаний.
Для получения дополнительной помощи обратитесь в службу технической поддержки EMC Isilon.
- Если оба узла отвечают с одинаковым номером (73 или 93), они подвержены проблеме, описанной в этой статье базы знаний. Эта проблема устранена в обновленной микропрограмме узла, включенной в node Firmware Package 10.1.6 и более поздних версий, а также в исправлении кода, включенного в OneFS 8.1.0.4 и более поздние версии. Хотя каждое обновление по отдельности устраняет проблему, оба выпуска содержат другие важные исправления, поэтому рекомендуется установить и то, и другое.
Affected Products
Isilon, Isilon Gen6Article Properties
Article Number: 000056963
Article Type: Solution
Last Modified: 28 Jun 2023
Version: 6
Find answers to your questions from other Dell users
Support Services
Check if your device is covered by Support Services.