Azure Local: Предварительная проверка сети завершается сбоем в полностью конвергентной топологии, когда на ToR-коммутаторах настроена изоляция сети хранения
Summary: При развертывании локального экземпляра Azure с полностью конвергентной сетевой топологией происходит сбой предварительных проверок сети. Это происходит, если изоляция сети хранения настроена на стоечных коммутаторах верхнего уровня (ToR) в соответствии с передовыми подходами. ...
Symptoms
Предварительные проверки сети завершаются сбоем во время развертывания локального экземпляра Azure с полностью конвергентной сетевой топологией.
Cause
В случае сбоя предварительной проверки предварительная попытка подключиться с IP-адресов, назначенных портам сетевой платы хранилища 1, к IP-адресам, назначенным портам сетевых плат 2 хранилища на других участниках экземпляра. Эта попытка подключения завершается сбоем, когда сегментация сети VLAN, реализованная в коммутаторах ToR, разделяет сетевой трафик хранения. Такая сегментация предотвращает переключение сетевого трафика, поступающего через порты сетевых плат 1 хранилища на каждом из участников, на порты сетевых плат 2 хранилища на каждом участнике. Эта стратегия сегментации сети соответствует рекомендациям по проектированию локальной сети Azure, описанным корпорацией Майкрософт.
Resolution
Добавьте обе VLAN хранилища в магистраль VLAN хранилища на каждом коммутаторе ToR, который подключается к портам физических сетевых плат (pNIC) локальных участников Azure. Как правило, в каждом коммутаторе ToR есть только одна VLAN хранилища, назначенная магистрали VLAN порта коммутатора. Добавление обеих VLAN хранилища в магистраль VLAN порта коммутатора позволяет успешно завершить предварительную проверку сети.
Additional Information
Для трафика локальной сети хранилища Azure используются высокопроизводительные протоколы RDMA, которые чувствительны к сетевой задержке. Минимизация переходов коммутатора снижает сетевую задержку и очень выгодна для сетевого трафика RDMA. Рекомендации по проектированию локальной сети Azure используют одну IP-подсеть и VLAN для сетевого трафика, исходящего из портов сетевой платы 1, и другую IP-подсеть и VLAN для сетевого трафика, исходящего из портов сетевой платы 2. Этот тип сегментации сетевого трафика предотвращает ненужную передачу сетевого трафика между обоими коммутаторами ToR и дополнительные переходы коммутаторов.
Подробные сведения см. в статье Требования к сети узла для локального Azure — Локальный Azure | Microsoft Learn.
Топология полностью конвергентной сети включает в себя две pNIC, которые используются для всего трафика локальной сети Azure. К этим двум сетевым платам привязан виртуальный коммутатор (vSwitch) со встроенным объединением коммутаторов (SET). В разделе хоста представлены три виртуальные сетевые карты (vNIC), которые подключены к коммутатору vSwitch в разделе хоста. Две виртуальные сетевые платы используются для сетевого трафика хранения, а третья виртуальная сетевая плата — для сетевого трафика управления.
Описание топологии полностью конвергентной сети можно найти по следующей ссылке: