PowerFlex 4.X: Falha na conversão do SO devido a IPs virtuais ausentes
Summary: A conversão do sistema operacional de um grupo de recursos (RG) é concluída e causa DU quando um cluster do MDM tem menos IPs virtuais do que IPs de dados do MDM.
Symptoms
- A operação de conversão do sistema operacional é executada em um ou mais nós em um RG Storage Only (SO) e o processo apresenta falha.
- O nó de destino é convertido com sucesso para o sistema operacional SLES.
- O cluster do MDM tem um modo de configuração diferente após a operação de conversão e o estado é exibido como Degradado.
--query_clusterA saída pode mostrar nós que originalmente eram MDMs do Manager como Tie-Breaker e vice-versa. A função pode não corresponder àactor_roleno arquivo de configuração do MDM -/opt/emc/scaleio/mdm/cfg/conf.txt.
Exemplo:
Conversão pré-SO
O cluster do MDM tem um modo de configuração 5_node e um estadonormal (íntegro), e o nó xxx002 está em um status normal e um MDM gerenciador (primário):

Conversão pós-SO
O cluster do MDM tem um modo de configuração 3_node e um estadodegradado (não íntegro), e o nó xxx002 está em status de erro e um MDM gerenciador (secundário):

O arquivo de configuração do nó xxx002 está definido como actor_role_is_manager=0, ou seja, Tie Breaker:

Impacto
O cluster do MDM está em um estado inesperado e com falha – possível DU.
Cause
Durante uma conversão de SO, a PFMP reequilibra as funções do MDM entre os nós disponíveis. A PFMP usa os endereços IP virtuais do cluster do MDM como âncora para instalar e adicionar nós de cluster do MDM e gerenciador de standby/tie-breakers.
Depois que o sistema operacional de um nó é convertido com sucesso em SLES, o processo de rebalanceamento dos nós do cluster do MDM é acionado e, como os endereços IP virtuais indicam que há 2 IPs para procurar e que os nós têm 4 IPs, isso faz com que a pesquisa falhe e a instalação prossiga, padronizando a instalação para um tie breaker em espera.
Cluster:
Name: sio-1, ID: 0a1707234b50f20f, Mode: 5_node, State: Normal, Active: 5/5, Replicas: 3/3
...
Virtual IP Addresses: 10.122.160.100, 10.123.160.100 <<<<<
Primary MDM:
Name: sio-101, ID: 0x6bd7be1d61b4c900
IP Addresses: 10.122.160.101, 10.123.160.101, 10.122.224.101, 10.123.224.101, Port: 9011, Virtual IP interfaces: bond0.393, bond1.398 <<<<<
...
Secondary MDMs:
Name: sio-102, ID: 0x0b5a343e4caba901
IP Addresses: 10.122.160.102, 10.123.160.102, 10.122.224.102, 10.123.224.102, Port: 9011, Virtual IP interfaces: bond0.393, bond1.398 <<<<<
....
Name: sio-104, ID: 0x749bb9791864d903
IP Addresses: 10.122.160.104, 10.123.160.104, 10.122.224.104, 10.123.224.104, Port: 9011, Virtual IP interfaces: bond0.393, bond1.398 <<<<<
....
Tie-Breakers:
Name: sio-105, ID: 0x612f04b03a127004
IP Addresses: 10.122.160.105, 10.123.160.105, 10.122.224.105, 10.123.224.105, Port: 9011 <<<<<
...
Name: sio-103, ID: 0x154f223f2046a305
IP Addresses: 10.122.160.103, 10.123.160.103, 10.122.224.103, 10.123.224.103, Port: 9011 <<<<<
...
Standby MDMs:
Name: sio-106, ID: 0x6bd7be1d61b4c900, Manager
IP Addresses: 10.122.160.106, 10.123.160.106, 10.122.224.106, 10.123.224.106, Port: 9011, Virtual IP interfaces: bond0.393, bond1.398 <<<<<
...
Name: sio-107, ID: 0x612f04b03a127004, Tie-Breaker
IP Addresses: 10.122.160.107, 10.123.160.107, 10.122.224.107, 10.123.224.107, Port: 9011 <<<<<
Name: sio-108, ID: 0x0b5a343e4caba901, Manager
IP Addresses: 10.122.160.108, 10.123.160.108, 10.122.224.108, 10.123.224.108, Port: 9011, Virtual IP interfaces: bond0.393, bond1.398 <<<<<
...
Name: sio-112, ID: 0x612f04b03a127004, Tie-Breaker
IP Addresses: 10.122.160.112, 10.123.160.112, 10.122.224.112, 10.123.224.112, Port: 9011 <<<<<
Como resultado, o processo de instalação será revertido para a função padrão do MDM, Tie-Breaker, e todos os MDMs serão instalados como Tie-Breakers, quebrando assim o cluster do MDM:
DEBUG [2025-11-23T06:51:03.699277] 316828: provider/elementmanager/scaleio.rb:5702:in `add_mdm': scaleio-block-legacy-gateway: Failed to add MDM sio-102 to VxOS cluster with error {"message"=>"Illegal number of IP addresses. The Primary MDM, the Secondary MDM, and the Tie-Breaker must each have the same number of IP addresses.", "httpStatusCode"=>500, "errorCode"=>298}. Retying 1
Resolution
Se o cluster do MDM estiver em um estado de falha, conforme mencionado acima, entre em contato com a equipe do EE para obter assistência na recuperação do cluster.
Para evitar uma conversão de SO com falha ou uma DU, execute as seguintes ações antes de tentar uma conversão de SO.
Os membros do cluster do MDM e os MDMs em espera devem ter a mesma contagem de endereços IP (IPs de DADOS) que os endereços IP virtuais do cluster, aumentando as interfaces IP virtuais e adicionando endereços IP virtuais ou reduzindo os IPs de dados do MDM.
Siga uma das seguintes opções para corrigir o problema: aumente os IPs virtuais do cluster MDM para alinhar com a contagem de IP DATA dos MDMs primários/secundários/tiebreaker/standby ou reduza os IPs de DATA para alinhar com a contagem de IP virtuais do cluster MDM.
Aumente os IPs virtuais do cluster MDM.
- Adicione os virtual_ip_interfacena mesma ordem das funções de IP correspondentes do SDS.
- Certifique-se de adicionar os virtual_ip_interfacena mesma ordem que os cluster_virtual_ipcorrespondentes.
- Certifique-se de adicionar os novos cluster_virtual_ipao SDC.
1) Adicione IPs virtuais adicionais ao cluster e interfaces de IP virtual aos MDMs primário e secundário.
Um. Limpe os IPs virtuais existentes:
scli --modify_cluster_virtual_ips --clear_all
B. Adicione os IPs virtuais antigos e novos (lista separada por vírgulas, omita o espaço após cada vírgula):
scli --modify_cluster_virtual_ips --cluster_virtual_ip <Virtual IP 1,Virtual IP 2,Virtual IP 3,Virtual IP 4>
c. Limpe as interfaces IP virtuais existentes:
scli --modify_virtual_ip_interfaces --clear_all
2) Atualize o SDC/s e qualquer outro client que utilize os IPs virtuais do cluster com os novos IPs:
Para que as alterações entrem em vigor, é necessário reiniciar o servidor.
- Linux:
/opt/emc/scaleio/sdc/bin/drv_cfgA nova lista de endereços IP é separada por vírgulas e deve omitir o espaço após cada vírgula. Se você quiser manter o(s) endereço(s) existente(s), inclua-o(s) nesta lista.
drv_cfg --mod_mdm_ip --ip <One of the existing MDM IP addresses> <All MDM IP addresses>
- Windows:
C:\Program Files\emc\scaleio\sdc\bin\drv_cfg
A nova lista de endereços IP é separada por vírgulas e precisa omitir o espaço após cada vírgula. Se você quiser manter o(s) endereço(s) existente(s), inclua-o(s) nesta lista.
- ESXi:
- Obtenha a configuração em execução. O comando retornará uma string que representa todos os parâmetros de configuração do ESXi atualmente definidos, o GUID do SDC e os IPs do MDM:
cat /etc/vmware/esx.conf | grep scini | grep options
-
- Use os detalhes da saída para executar o comando e adicionar os novos IPs virtuais (lista separada por vírgulas, omita o espaço após cada vírgula):
<XXX> - é uma string GUID gerada pelo usuário. O GUID pode ser validado usando o comando SCLI '--query_all_sdc' no MDM primário. <> LIST_VIP_MDM_IPS é uma lista separada por vírgulas de todos os endereços IP do MDM ou o endereço IP virtual do MDM. Não inclua endereços IP tie breaker aqui.
- Use os detalhes da saída para executar o comando e adicionar os novos IPs virtuais (lista separada por vírgulas, omita o espaço após cada vírgula):
- Coloque o ESXi no modo de manutenção e reinicie.
3) Remova o RG usando a interface do usuário da PFMP e adicione novamente usando todos os endereços IP virtuais do cluster do MDM, antigos e novos.
4) Depois que a conversa sobre o sistema operacional for concluída com sucesso e o sistema estiver em um estado íntegro, para reverter as alterações, execute as etapas de 1 a 3.
Diminua os IPs de dados do MDM.
1) Reduza o cluster do MDM a um modo 3_node ou 1_node, com base no modo de cluster atual.
2) Adicione novamente todos os MDMs (em espera, TB e secundário), com menos IPs de dados do MDM, com base na quantidade de VIPs do cluster.
Versões afetadas
PFMP 4.x
Correção feita na versão
PFMP 5.1
Additional Information
Artigos relacionados:
PowerFlex 4.X: Falha na conversão do SO devido à ordem incorreta das funções de IP do SDS
PowerFlex 4.X: Falha na conversão do SO devido ao MDM em espera não configurado