PowerScale. Как определить контроллер подсети фабрики PowerScale InfiniBand

Samenvatting: Как определить контроллер подсети фабрики PowerScale InfiniBand.

Dit artikel is van toepassing op Dit artikel is niet van toepassing op Dit artikel is niet gebonden aan een specifiek product. Niet alle productversies worden in dit artikel vermeld.

Instructies

Введение

OpenSM предоставляет реализацию диспетчера и администрирования подсети InfiniBand (IB) и работает поверх OpenIB. OpenSM должен работать должным образом, чтобы весь трафик InfiniBand (IB), зависящий от OpenSM, работал должным образом. При возникновении проблемы с IB может потребоваться просмотреть журналы OpenSM, и для этого необходимо знать, какой журнал просматривать. Служба opensm работает на всех узлах, и каждый узел имеет собственные журналы OpenSM. Однако только мастер подсети фабрики IB выполняет обнаружение топологии, поэтому полная и точная информация содержится только в его журнале OpenSM. Таким образом, чтобы можно было определить, какое устройство выступает в качестве ведущего устройства подсети фабрики.

В конфигурации с двумя коммутаторами необходимо сопоставить журнал OpenSM с интерфейсом, к которому он привязан. Файлы opensm-1.topo и opensm-2.topo не всегда напрямую коррелируют с интерфейсами internal-a (int-a) и internal-b (int-b). Вы можете использовать значение адреса канального уровня интерфейса IB (lladdr), чтобы определить, с каким интерфейсом связан файл. Ниже описано, как это сделать.

ПРИМЕЧАНИЕ
Файл .topo генерируется при установлении соединения с коммутатором IB и содержит информацию, собранную за это время. Файл .log всегда будет сопровождать файл .topo . Файл .log содержит сообщения и сведения о топографии подключения InfiniBand. После того, как вы познакомитесь с мастером, вы можете просмотреть соответствующий . Файл журнала для получения информации о конкретной проблеме.  Только на файл топографии узла для ведущего устройства OpenSM можно положиться на правильный топологический файл фабрики.  Не следует использовать топологические файлы из других узлов.

 

 Последовательность действий

1. Установите соединение по протоколу SSH с узлом и войдите в систему с помощью учетной записи root. Оставайтесь на том же узле для выполнения остальных действий данной процедуры.

2. Определите главные модули OpenSM для каждого коммутатора.

В среде с двумя коммутаторами должно быть две выходные линии, по одной для каждого коммутатора.

isi_for_array -XI 'ps auxw | grep opensm' | grep master


В приведенном ниже примере для среды с одним коммутатором InfiniBand 0xe41d2d0300bc8fc2 соответствует lladdr сетевой платы Isilon для этого узла, а IsilonX210-S19-1 включает номер главного узла.

IsilonX210-S19-3# isi_for_array -XI 'ps auxw | grep opensm' | grep master
IsilonX210-S19-1: root    3757   0.0  0.0  28536   5036  -  S    23Feb17      3:56.20 opensm: 0xe41d2d0300bc8fc2 master (opensm)


3. Для каждого результата команды 2 определите, на какой интерфейс на узле ссылается в приведенных выше выходных данных, изучив lladdr из выходных данных ifconfig.  

Повторите этот шаг для каждого узла в выходных данных из шага 2, заменив <LNN> номером узла

isi_for_array -n <LNN> 'ifconfig ib0 ; ifconfig ib1' | grep -E "ib[01]"\|lladdr\|status

For our example, the interface of the master would be ib1 (lladdr is separated by a dot in this output for clarity in reading and ends in bc.8f.c2, the same as from the example in command 2 above.)

IsilonX210-S19-3# isi_for_array -n 1 'ifconfig ib0 ; ifconfig ib1' | grep -E "ib[01]"\|lladdr\|status
IsilonX210-S19-1: ib0: flags=8843<UP,BROADCAST,RUNNING,SIMPLEX,MULTICAST> metric 0 mtu 4092
IsilonX210-S19-1:       lladdr 0.0.0.48.fe.80.0.0.0.0.0.0.e4.1d.2d.3.0.bc.8f.c1
IsilonX210-S19-1:       status: inactive
IsilonX210-S19-1: ib1: flags=8843<UP,BROADCAST,RUNNING,SIMPLEX,MULTICAST> metric 0 mtu 2044
IsilonX210-S19-1:       lladdr 0.0.0.49.fe.80.0.0.0.0.0.0.e4.1d.2d.3.0.bc.8f.c2
IsilonX210-S19-1:       status: active

Extra informatie

Если на шаге 3 интерфейс отображается как неактивный, то его состояние можно игнорировать, так как он может отображаться как master.   

Если на коммутаторе имеется несколько ведущих модулей OpenSM и дополнительные главные порты не возникают из-за неактивной сетевой платы (NIC), обратитесь в службу технической поддержки PowerScale.

Если нет ведущих устройств OpenSM, убедитесь, что к коммутатору физически не подключены другие устройства, не входящие в кластер.  Сюда входят включенные узлы, которые не были добавлены в кластер или удалены из него.  Если в фабрике InfiniBand нет дополнительных подключений, возможно, коммутатор взял на себя роль ведущего.

При оптимальной настройке ведущим подсетью должен быть узел кластера, а не коммутатор IB или ненастроенный узел.

В редких случаях коммутатор IB может быть настроен в качестве собственного ведущего устройства подсети. Это может привести к проблемам, которые трудно диагностировать. Т.е. интерфейс IB не включается, коммутатор неправильно маршрутизирует трафик IB или даже препятствует присоединению узлов к кластеру.

Если коммутатор IB является главным, обратитесь в службу технической поддержки PowerScale.

Getroffen producten

Isilon Switches

Producten

PowerScale OneFS
Artikeleigenschappen
Artikelnummer: 000004114
Artikeltype: How To
Laatst aangepast: 07 jan. 2026
Versie:  8
Vind antwoorden op uw vragen via andere Dell gebruikers
Support Services
Controleer of uw apparaat wordt gedekt door Support Services.