PowerFlex SDC protokoluje chyby I/O po ztrátě konektivity na jedné síťové kartě

Summary: SDC může při ztrátě jedné síťové karty v systému s více síťovými kartami nakonfigurovanými pro systém PowerFlex vracet do aplikace chyby I/O.

This article applies to This article does not apply to This article is not tied to any specific product. Not all product versions are identified in this article.

Symptoms

Scénář
Systém PowerFlex používá pro každou komponentu více připojení (například 2 připojení s rolí IP SDS "All" nebo čtyři připojení – 2 pro "pouze SDS" a 2 pro "SDC").

Problém se projevuje při ztrátě jednoho připojení (tj. po restartování jednoho přepínače, vypnutí jedné síťové karty atd.).

V celém systému neexistuje žádná DU (DATA_FAILED kapacita).

Symptomy
SDC hlásí odpojení od jednoho (nebo více) SDS, přestože je nakonfigurováno více připojení:

 <6>2021-09-20T06:52:29.617016+00:00 sdc001 kernel: [5965962.215707] bond-glance: link status down for backup interface eth4.2223, disabling it in 1000 ms
<6>2021-09-20T06:52:29.628748+00:00 sdc001 kernel: [5965962.227665] bond-glance: link status down for backup interface eth4.2223, disabling it in 1000 ms
<3>2021-09-20T06:52:29.628773+00:00 sdc001 kernel: [5965962.227668] bond-glance: invalid new link 1 on slave eth4.2223
<6>2021-09-20T06:52:30.638572+00:00 sdc001 kernel: [5965963.239669] bond-nfs: link status definitely down for interface eth4.2226, disabling it
<6>2021-09-20T06:52:30.662562+00:00 sdc001 kernel: [5965963.263771] bond-migration: link status definitely down for interface eth4.2222, disabling it
<6>2021-09-20T06:52:30.662585+00:00 sdc001 kernel: [5965963.263774] bond-migration: making interface eth5.2222 the new active one
<6>2021-09-20T06:52:30.670568+00:00 sdc001 kernel: [5965963.271749] bond-glance: link status definitely down for interface eth4.2223, disabling it
<3>2021-09-20T06:52:32.600563+00:00 sdc001 kernel: [5965965.175504] ScaleIO netCon_IsKaNeeded:3761 :CON 00000000515dfcb3 didn't receive message for 30 iterations.  Marking as down
<3>2021-09-20T06:52:32.600587+00:00 sdc001 kernel: [5965965.186972] ScaleIO netCon_IsKaNeeded:3761 :CON 0000000030837167 didn't receive message for 30 iterations.  Marking as down
<3>2021-09-20T06:52:32.646130+00:00 sdc001 kernel: [5965965.251039] ScaleIO netCon_IsKaNeeded:3761 :CON 00000000c6b7b707 didn't receive message for 30 iterations.  Marking as down
<3>2021-09-20T06:52:32.657522+00:00 sdc001 kernel: [5965965.251092] [5786457902] Disconnected from SDS with ID 2b16b44c00000001  < ======================================================= unexpected
(...)
<3>2021-09-20T06:52:52.894622+00:00 sdc001: [5965985.494552] ScaleIO mapVolIO_ReportIOErrorIfNeeded:491 :[23145851856] IO-ERROR Type WRITE. comb: 24280000 0332. offsetInComb 1464872. SizeInLB 16. SDS_ID 2b16b44c00000001. Comb Gen 2c3f. Head Gen 2f1c. StartLB c793228.
<3>2021-09-20T06:52:52.894624+00:00 sdc001: [5965985.494555] ScaleIO mapVolIO_ReportIOErrorIfNeeded:512 :Vol ID 0x587d75290000000b. Last vol network error status NOT_CONN(4) Reason (ERROR) RC (ERROR) Retry count (20) chan (2)

 

Důsledky

 Vstupně-výstupní chyby vrácené do aplikace.

Cause

Tento druh chyb pochází z nějaké špatné konfigurace sítě - jedna z karet NIC na kterékoli z komponent (SDS nebo SDC) může být vložena do nesprávné sítě VLAN, vůbec se nezobrazí, může mít přiřazenou nesprávnou IP adresu atd. 

V tomto konkrétním případě byla jedna ze síťových karet na úložišti SDS "2b16b44c00000001" přiřazena k nesprávné síti VLAN, takže komunikace mezi SDC-SDS probíhala přes jednu síťovou kartu – když došlo k výpadku připojení, SDC již nemohla s tímto SDS komunikovat. Vzhledem k tomu, že se používaly role IP, zůstával tento SDS připojený k uzlu MDM a dalším SDS přes síťové karty "pouze SDS", takže uzel MDM neměl důvod data znovu sestavovat.

Resolution

Ujistěte se, že jsou všechny komponenty připojeny podle očekávání – pomocí příkazů "netstat" a/nebo scli (přesné příkazy závisí na verzi PowerFlex) ověřte připojení.

 

Affected Products

ScaleIO, PowerFlex Software

Products

VxFlex Product Family, VxFlex Ready Node
Article Properties
Article Number: 000193330
Article Type: Solution
Last Modified: 17 Apr 2025
Version:  3
Find answers to your questions from other Dell users
Support Services
Check if your device is covered by Support Services.