Erreurs d’E/S de journalisation du SDC PowerFlex après une perte de connectivité sur une seule carte réseau

Summary: Le SDC peut renvoyer des erreurs d’E/S à l’application en cas de perte de la connectivité d’une seule carte réseau dans un système doté de plusieurs cartes réseau configurées pour PowerFlex. ...

This article applies to This article does not apply to This article is not tied to any specific product. Not all product versions are identified in this article.

Symptoms

Scénario
PowerFlex utilise plusieurs connexions pour chaque composant (par exemple, 2 connexions avec le rôle IP SDS « All » ou 4 connexions : 2 pour « SDS-only » et 2 pour « SDC-only »).

Le problème se manifeste lorsqu’une seule connexion est perdue (c’est-à-dire après le redémarrage d’un seul commutateur, l’arrêt d’une seule carte réseau, etc.).

Il n’existe aucune DU (capacité DATA_FAILED) sur l’ensemble du système.

Symptômes
Le SDC signale la déconnexion d’un seul (ou plusieurs) SDS malgré la configuration de plusieurs connexions :

 <6>2021-09-20T06:52:29.617016+00:00 sdc001 kernel: [5965962.215707] bond-glance: link status down for backup interface eth4.2223, disabling it in 1000 ms
<6>2021-09-20T06:52:29.628748+00:00 sdc001 kernel: [5965962.227665] bond-glance: link status down for backup interface eth4.2223, disabling it in 1000 ms
<3>2021-09-20T06:52:29.628773+00:00 sdc001 kernel: [5965962.227668] bond-glance: invalid new link 1 on slave eth4.2223
<6>2021-09-20T06:52:30.638572+00:00 sdc001 kernel: [5965963.239669] bond-nfs: link status definitely down for interface eth4.2226, disabling it
<6>2021-09-20T06:52:30.662562+00:00 sdc001 kernel: [5965963.263771] bond-migration: link status definitely down for interface eth4.2222, disabling it
<6>2021-09-20T06:52:30.662585+00:00 sdc001 kernel: [5965963.263774] bond-migration: making interface eth5.2222 the new active one
<6>2021-09-20T06:52:30.670568+00:00 sdc001 kernel: [5965963.271749] bond-glance: link status definitely down for interface eth4.2223, disabling it
<3>2021-09-20T06:52:32.600563+00:00 sdc001 kernel: [5965965.175504] ScaleIO netCon_IsKaNeeded:3761 :CON 00000000515dfcb3 didn't receive message for 30 iterations.  Marking as down
<3>2021-09-20T06:52:32.600587+00:00 sdc001 kernel: [5965965.186972] ScaleIO netCon_IsKaNeeded:3761 :CON 0000000030837167 didn't receive message for 30 iterations.  Marking as down
<3>2021-09-20T06:52:32.646130+00:00 sdc001 kernel: [5965965.251039] ScaleIO netCon_IsKaNeeded:3761 :CON 00000000c6b7b707 didn't receive message for 30 iterations.  Marking as down
<3>2021-09-20T06:52:32.657522+00:00 sdc001 kernel: [5965965.251092] [5786457902] Disconnected from SDS with ID 2b16b44c00000001  < ======================================================= unexpected
(...)
<3>2021-09-20T06:52:52.894622+00:00 sdc001: [5965985.494552] ScaleIO mapVolIO_ReportIOErrorIfNeeded:491 :[23145851856] IO-ERROR Type WRITE. comb: 24280000 0332. offsetInComb 1464872. SizeInLB 16. SDS_ID 2b16b44c00000001. Comb Gen 2c3f. Head Gen 2f1c. StartLB c793228.
<3>2021-09-20T06:52:52.894624+00:00 sdc001: [5965985.494555] ScaleIO mapVolIO_ReportIOErrorIfNeeded:512 :Vol ID 0x587d75290000000b. Last vol network error status NOT_CONN(4) Reason (ERROR) RC (ERROR) Retry count (20) chan (2)

 

Impact

 Les erreurs d’E/S sont renvoyées à l’application.

Cause

Ce type d’erreurs provient d’une mauvaise configuration du réseau : l’une des cartes réseau de l’un des composants (SDS ou SDC) peut être placée dans un VLAN incorrect, ne pas être activée du tout, avoir une IP incorrecte, etc. 

Dans ce cas particulier, l’une des cartes réseau du SDS « 2b16b44c00000001 » a été affectée à un VLAN erroné, de sorte que la communication SDC-SDS se produisait effectivement via une seule carte NIC. Lorsque cette connexion est interrompue, le SDC ne peut plus communiquer avec ce SDS. Étant donné que les rôles IP étaient en cours d’utilisation, ce SDS est resté connecté au MDM et aux autres SDS sur des cartes NIC « SDS uniquement », de sorte que le MDM n’avait aucune raison de reconstruire les données.

Resolution

Assurez-vous que tous les composants sont connectés comme prévu. Utilisez les commandes « netstat » et/ou scli (les commandes exactes dépendent de la version de PowerFlex) pour vérifier la connectivité.

 

Affected Products

ScaleIO, PowerFlex Software

Products

VxFlex Product Family, VxFlex Ready Node
Article Properties
Article Number: 000193330
Article Type: Solution
Last Modified: 17 Apr 2025
Version:  3
Find answers to your questions from other Dell users
Support Services
Check if your device is covered by Support Services.