PowerFlex SDC logging av I/O-feil etter tap av tilkobling på ett enkelt nettverkskort

Summary: SDC kan returnere I/O-feil til programmet når du mister én enkelt NIC-tilkobling i et system med flere NIC-er konfigurert for PowerFlex.

This article applies to This article does not apply to This article is not tied to any specific product. Not all product versions are identified in this article.

Symptoms

Scenario
PowerFlex bruker flere tilkoblinger for hver komponent (for eksempel 2 tilkoblinger med SDS-IP-rolle "Alle" eller fire tilkoblinger – 2 for "SDS-only" og 2 for "SDC-only").

Problemet oppstår når en enkelt tilkobling går tapt (det vil si etter en enkelt omstart av svitsjen, avslutning av en enkelt nettverkskort osv.).

Det finnes ingen DU (DATA_FAILED kapasitet) i hele systemet.

Symptomer
SDC rapporterer frakobling fra ett enkelt (eller flere) SDS til tross for at flere tilkoblinger er konfigurert:

 <6>2021-09-20T06:52:29.617016+00:00 sdc001 kernel: [5965962.215707] bond-glance: link status down for backup interface eth4.2223, disabling it in 1000 ms
<6>2021-09-20T06:52:29.628748+00:00 sdc001 kernel: [5965962.227665] bond-glance: link status down for backup interface eth4.2223, disabling it in 1000 ms
<3>2021-09-20T06:52:29.628773+00:00 sdc001 kernel: [5965962.227668] bond-glance: invalid new link 1 on slave eth4.2223
<6>2021-09-20T06:52:30.638572+00:00 sdc001 kernel: [5965963.239669] bond-nfs: link status definitely down for interface eth4.2226, disabling it
<6>2021-09-20T06:52:30.662562+00:00 sdc001 kernel: [5965963.263771] bond-migration: link status definitely down for interface eth4.2222, disabling it
<6>2021-09-20T06:52:30.662585+00:00 sdc001 kernel: [5965963.263774] bond-migration: making interface eth5.2222 the new active one
<6>2021-09-20T06:52:30.670568+00:00 sdc001 kernel: [5965963.271749] bond-glance: link status definitely down for interface eth4.2223, disabling it
<3>2021-09-20T06:52:32.600563+00:00 sdc001 kernel: [5965965.175504] ScaleIO netCon_IsKaNeeded:3761 :CON 00000000515dfcb3 didn't receive message for 30 iterations.  Marking as down
<3>2021-09-20T06:52:32.600587+00:00 sdc001 kernel: [5965965.186972] ScaleIO netCon_IsKaNeeded:3761 :CON 0000000030837167 didn't receive message for 30 iterations.  Marking as down
<3>2021-09-20T06:52:32.646130+00:00 sdc001 kernel: [5965965.251039] ScaleIO netCon_IsKaNeeded:3761 :CON 00000000c6b7b707 didn't receive message for 30 iterations.  Marking as down
<3>2021-09-20T06:52:32.657522+00:00 sdc001 kernel: [5965965.251092] [5786457902] Disconnected from SDS with ID 2b16b44c00000001  < ======================================================= unexpected
(...)
<3>2021-09-20T06:52:52.894622+00:00 sdc001: [5965985.494552] ScaleIO mapVolIO_ReportIOErrorIfNeeded:491 :[23145851856] IO-ERROR Type WRITE. comb: 24280000 0332. offsetInComb 1464872. SizeInLB 16. SDS_ID 2b16b44c00000001. Comb Gen 2c3f. Head Gen 2f1c. StartLB c793228.
<3>2021-09-20T06:52:52.894624+00:00 sdc001: [5965985.494555] ScaleIO mapVolIO_ReportIOErrorIfNeeded:512 :Vol ID 0x587d75290000000b. Last vol network error status NOT_CONN(4) Reason (ERROR) RC (ERROR) Retry count (20) chan (2)

 

Innvirkning

 I/O-feil returnert til applikasjonen.

Cause

Denne typen feil kommer fra en slags nettverksfeilkonfigurasjon - en av NIC-ene på noen av komponentene (SDS eller SDC) kan bli satt inn i feil VLAN, ikke tatt opp i det hele tatt, ha feil IP tildelt osv. 

I dette tilfellet ble en av NIC-ene på SDS "2b16b44c00000001" tildelt feil VLAN, så effektivt foregikk SDC-SDS-kommunikasjon over et enkelt NIC - da denne tilkoblingen gikk ned, kunne SDC ikke lenger snakke med denne SDS. Siden IP-roller var i bruk, forble denne SDS koblet til MDM og andre SDS over "SDS-only" NIC-er, så MDM hadde ingen grunn til å gjenoppbygge dataene.

Resolution

Kontroller at alle komponenter er tilkoblet som forventet – bruk kommandoene "netstat" og/eller scli (nøyaktige kommandoer avhenger av PowerFlex-versjonen) for å bekrefte tilkoblingen.

 

Affected Products

ScaleIO, PowerFlex Software

Products

VxFlex Product Family, VxFlex Ready Node
Article Properties
Article Number: 000193330
Article Type: Solution
Last Modified: 17 Apr 2025
Version:  3
Find answers to your questions from other Dell users
Support Services
Check if your device is covered by Support Services.