Azure Local: Falha na pré-verificação de validação de rede na topologia totalmente convergente quando o isolamento da rede de armazenamento é configurado no topo dos switches de rack
Summary: A implementação de uma instância local do Azure com a topologia de rede totalmente convergente falha nas pré-verificações de validação de rede. Isso ocorrerá se o isolamento da rede de armazenamento for configurado nos switches topo de rack (ToR) de acordo com as práticas recomendadas. ...
Symptoms
As pré-verificações de validação de rede falham durante a implementação de uma instância local do Azure com uma topologia de rede totalmente convergente.
Cause
A pré-verificação com falha tenta se conectar dos endereços IP atribuídos às portas 1 da NIC de armazenamento aos endereços IP atribuídos às portas 2 da NIC de armazenamento em outros membros da instância. Essa tentativa de conexão falha quando a segmentação de rede VLAN implementada nos switches ToR separa o tráfego da rede de armazenamento. Essa segmentação impede que o tráfego de rede originado nas portas NIC de armazenamento 1 em cada membro passe para as portas NIC de armazenamento 2 em cada membro. Essa estratégia de segmentação de rede segue as práticas recomendadas de design de rede local do Azure, conforme documentado pela Microsoft.
Resolution
Adicione ambas as VLANs de armazenamento ao tronco de VLAN de armazenamento em cada switch ToR que conecta as portas físicas NIC (pNICs) dos membros locais do Azure. Normalmente, cada switch ToR tem apenas uma VLAN de armazenamento atribuída ao tronco de VLAN da porta do switch. Adicionar ambas as VLANs de armazenamento ao tronco de VLAN da porta do switch permite que a pré-verificação de validação de rede seja concluída com sucesso.
Additional Information
O tráfego de rede de armazenamento local do Azure usa protocolos RDMA de alto desempenho que são sensíveis à latência de rede. Minimizar os saltos de switch reduz a latência de rede e é altamente benéfico para o tráfego de rede RDMA. A prática recomendada de design de rede local do Azure usa uma sub-rede IP e VLAN para o tráfego de rede originado das portas NIC 1 e uma sub-rede IP e VLAN diferentes para o tráfego de rede originado das portas NIC 2. Esse tipo de segmentação de tráfego de rede impede que o tráfego de rede de armazenamento flua desnecessariamente entre os dois switches ToR e que gere saltos adicionais de switch.
Os detalhes podem ser encontrados em Requisitos de rede do host para o Azure Local - Azure Local | Microsoft Learn.
A topologia de rede totalmente convergente envolve duas pNICs que são usadas para todo o tráfego de rede local do Azure. Essas duas pNICs têm um switch virtual (vSwitch) de agrupamento incorporado (SET) vinculado a elas. Três NICs virtuais (vNICs) são apresentadas à partição do host e conectadas ao vSwitch na partição do host. Duas vNICs são usadas para tráfego de rede de armazenamento, e a terceira vNIC é usada para tráfego de rede de gerenciamento.
Uma descrição da topologia de rede totalmente convergente pode ser encontrada no seguinte link: