Erros de E/S de log do PowerFlex SDC após perder a conectividade em uma única NIC

Summary: O SDC pode retornar erros de E/S para o aplicativo ao perder uma conectividade de NIC única em um sistema com várias NICs configuradas para PowerFlex.

This article applies to This article does not apply to This article is not tied to any specific product. Not all product versions are identified in this article.

Symptoms

Cenário
O PowerFlex usa várias conexões para cada componente (por exemplo, 2 conexões com função IP SDS "All" ou quatro conexões - 2 para "SDS-only" e 2 para "SDC-only").

O problema se manifesta quando uma única conexão é perdida (ou seja, após a reinicialização de um único switch, desligamento de uma NIC etc.).

Não há DU (capacidade DATA_FAILED) em todo o sistema.

Sintomas
O SDC relata a desconexão de um único (ou mais) SDS, apesar de ter várias conexões configuradas:

 <6>2021-09-20T06:52:29.617016+00:00 sdc001 kernel: [5965962.215707] bond-glance: link status down for backup interface eth4.2223, disabling it in 1000 ms
<6>2021-09-20T06:52:29.628748+00:00 sdc001 kernel: [5965962.227665] bond-glance: link status down for backup interface eth4.2223, disabling it in 1000 ms
<3>2021-09-20T06:52:29.628773+00:00 sdc001 kernel: [5965962.227668] bond-glance: invalid new link 1 on slave eth4.2223
<6>2021-09-20T06:52:30.638572+00:00 sdc001 kernel: [5965963.239669] bond-nfs: link status definitely down for interface eth4.2226, disabling it
<6>2021-09-20T06:52:30.662562+00:00 sdc001 kernel: [5965963.263771] bond-migration: link status definitely down for interface eth4.2222, disabling it
<6>2021-09-20T06:52:30.662585+00:00 sdc001 kernel: [5965963.263774] bond-migration: making interface eth5.2222 the new active one
<6>2021-09-20T06:52:30.670568+00:00 sdc001 kernel: [5965963.271749] bond-glance: link status definitely down for interface eth4.2223, disabling it
<3>2021-09-20T06:52:32.600563+00:00 sdc001 kernel: [5965965.175504] ScaleIO netCon_IsKaNeeded:3761 :CON 00000000515dfcb3 didn't receive message for 30 iterations.  Marking as down
<3>2021-09-20T06:52:32.600587+00:00 sdc001 kernel: [5965965.186972] ScaleIO netCon_IsKaNeeded:3761 :CON 0000000030837167 didn't receive message for 30 iterations.  Marking as down
<3>2021-09-20T06:52:32.646130+00:00 sdc001 kernel: [5965965.251039] ScaleIO netCon_IsKaNeeded:3761 :CON 00000000c6b7b707 didn't receive message for 30 iterations.  Marking as down
<3>2021-09-20T06:52:32.657522+00:00 sdc001 kernel: [5965965.251092] [5786457902] Disconnected from SDS with ID 2b16b44c00000001  < ======================================================= unexpected
(...)
<3>2021-09-20T06:52:52.894622+00:00 sdc001: [5965985.494552] ScaleIO mapVolIO_ReportIOErrorIfNeeded:491 :[23145851856] IO-ERROR Type WRITE. comb: 24280000 0332. offsetInComb 1464872. SizeInLB 16. SDS_ID 2b16b44c00000001. Comb Gen 2c3f. Head Gen 2f1c. StartLB c793228.
<3>2021-09-20T06:52:52.894624+00:00 sdc001: [5965985.494555] ScaleIO mapVolIO_ReportIOErrorIfNeeded:512 :Vol ID 0x587d75290000000b. Last vol network error status NOT_CONN(4) Reason (ERROR) RC (ERROR) Retry count (20) chan (2)

 

Impacto

 Erros de E/S retornados ao aplicativo.

Cause

Esse tipo de erro vem de algum tipo de configuração incorreta da rede - uma das NICs em qualquer um dos componentes (SDS ou SDC) pode ser colocada em uma VLAN errada, não ser ativada, ter o IP errado atribuído etc. 

Nesse caso específico, uma das NICs no SDS "2b16b44c00000001" foi atribuída a uma VLAN errada, portanto, efetivamente a comunicação SDC-SDS estava acontecendo em uma única NIC — quando essa conexão caiu, o SDC não conseguia mais se comunicar com esse SDS. Como as funções de IP estavam em uso, esse SDS permanecia conectado ao MDM e a outros SDS por meio de NICs "somente SDS", portanto, o MDM não tinha motivo para reconstruir os dados.

Resolution

Certifique-se de que todos os componentes estejam conectados conforme o esperado - use os comandos "netstat" e/ou scli (os comandos exatos dependem da versão do PowerFlex) para verificar a conectividade.

 

Affected Products

ScaleIO, PowerFlex Software

Products

VxFlex Product Family, VxFlex Ready Node
Article Properties
Article Number: 000193330
Article Type: Solution
Last Modified: 17 Apr 2025
Version:  3
Find answers to your questions from other Dell users
Support Services
Check if your device is covered by Support Services.