I/O-fel vid PowerFlex SDC-loggning efter att anslutningen till ett enskilt nätverkskort har brutits
Summary: SDC kan returnera I/O-fel till programmet när en enskild NIC-anslutning förloras i ett system med flera nätverkskort som konfigurerats för PowerFlex.
Symptoms
Scenario
PowerFlex använder flera anslutningar för varje komponent (t.ex. 2 anslutningar med SDS IP-rollen "Alla" eller fyra anslutningar – 2 för "Endast SDS" och 2 för "Endast SDC").
Problemet visar sig när en enskild anslutning bryts (det vill säga efter en omstart av en enskild switch, avstängning av ett enda nätverkskort osv.).
Det finns ingen DU (DATA_FAILED-kapacitet) i hela systemet.
Symtom
SDC rapporterar frånkoppling från en enda (eller flera) SDS trots att flera anslutningar har konfigurerats:
<6>2021-09-20T06:52:29.617016+00:00 sdc001 kernel: [5965962.215707] bond-glance: link status down for backup interface eth4.2223, disabling it in 1000 ms <6>2021-09-20T06:52:29.628748+00:00 sdc001 kernel: [5965962.227665] bond-glance: link status down for backup interface eth4.2223, disabling it in 1000 ms <3>2021-09-20T06:52:29.628773+00:00 sdc001 kernel: [5965962.227668] bond-glance: invalid new link 1 on slave eth4.2223 <6>2021-09-20T06:52:30.638572+00:00 sdc001 kernel: [5965963.239669] bond-nfs: link status definitely down for interface eth4.2226, disabling it <6>2021-09-20T06:52:30.662562+00:00 sdc001 kernel: [5965963.263771] bond-migration: link status definitely down for interface eth4.2222, disabling it <6>2021-09-20T06:52:30.662585+00:00 sdc001 kernel: [5965963.263774] bond-migration: making interface eth5.2222 the new active one <6>2021-09-20T06:52:30.670568+00:00 sdc001 kernel: [5965963.271749] bond-glance: link status definitely down for interface eth4.2223, disabling it <3>2021-09-20T06:52:32.600563+00:00 sdc001 kernel: [5965965.175504] ScaleIO netCon_IsKaNeeded:3761 :CON 00000000515dfcb3 didn't receive message for 30 iterations. Marking as down <3>2021-09-20T06:52:32.600587+00:00 sdc001 kernel: [5965965.186972] ScaleIO netCon_IsKaNeeded:3761 :CON 0000000030837167 didn't receive message for 30 iterations. Marking as down <3>2021-09-20T06:52:32.646130+00:00 sdc001 kernel: [5965965.251039] ScaleIO netCon_IsKaNeeded:3761 :CON 00000000c6b7b707 didn't receive message for 30 iterations. Marking as down <3>2021-09-20T06:52:32.657522+00:00 sdc001 kernel: [5965965.251092] [5786457902] Disconnected from SDS with ID 2b16b44c00000001 < ======================================================= unexpected (...) <3>2021-09-20T06:52:52.894622+00:00 sdc001: [5965985.494552] ScaleIO mapVolIO_ReportIOErrorIfNeeded:491 :[23145851856] IO-ERROR Type WRITE. comb: 24280000 0332. offsetInComb 1464872. SizeInLB 16. SDS_ID 2b16b44c00000001. Comb Gen 2c3f. Head Gen 2f1c. StartLB c793228. <3>2021-09-20T06:52:52.894624+00:00 sdc001: [5965985.494555] ScaleIO mapVolIO_ReportIOErrorIfNeeded:512 :Vol ID 0x587d75290000000b. Last vol network error status NOT_CONN(4) Reason (ERROR) RC (ERROR) Retry count (20) chan (2)
Påverkan
I/O-fel returnerades till programmet.
Cause
Den här typen av fel kommer från någon form av felkonfiguration av nätverket - ett av nätverkskorten på någon av komponenterna (SDS eller SDC) kan vara placerat i fel VLAN, inte tas upp alls, ha fel IP tilldelad etc.
I det här specifika fallet tilldelades ett av nätverkskorten på SDS "2b16b44c00000001" till ett felaktigt VLAN, så i praktiken skedde SDC-SDS-kommunikation över ett enda nätverkskort - när denna anslutning gick ner kunde SDC inte längre prata med denna SDS. Eftersom IP-roller användes förblev denna SDS ansluten till MDM och andra SDS över nätverkskort med endast SDS, så MDM-enheten hade ingen anledning att återskapa data.
Resolution
Kontrollera att alla komponenter är anslutna som förväntat – använd kommandona "netstat" och/eller "scli" (exakta kommandon beror på PowerFlex-version) för att verifiera anslutningen.