1つのNICで接続を失った後のI/OエラーをPowerFlex SDCが記録する

Summary: PowerFlex用に複数のNICが構成されているシステムで単一のNIC接続が失われると、SDCがI/Oエラーをアプリケーションに返すことがあります。

This article applies to This article does not apply to This article is not tied to any specific product. Not all product versions are identified in this article.

Symptoms

シナリオ
PowerFlexは、各コンポーネントに対して複数の接続を使用します(たとえば、SDS IPロールが「All」の2つの接続、または4つの接続(「SDS専用」の場合は2つ、「SDCのみ」の場合は2つ)。

この問題は、1つの接続が失われた場合(つまり、1つのスイッチを再起動した後、1つのNICをシャットダウンした後など)に発生します。

システム全体にDU(DATA_FAILED容量)はありません。

症状
複数の接続が構成されているにもかかわらず、SDCが1つ(または複数)のSDSからの切断を報告します。

 <6>2021-09-20T06:52:29.617016+00:00 sdc001 kernel: [5965962.215707] bond-glance: link status down for backup interface eth4.2223, disabling it in 1000 ms
<6>2021-09-20T06:52:29.628748+00:00 sdc001 kernel: [5965962.227665] bond-glance: link status down for backup interface eth4.2223, disabling it in 1000 ms
<3>2021-09-20T06:52:29.628773+00:00 sdc001 kernel: [5965962.227668] bond-glance: invalid new link 1 on slave eth4.2223
<6>2021-09-20T06:52:30.638572+00:00 sdc001 kernel: [5965963.239669] bond-nfs: link status definitely down for interface eth4.2226, disabling it
<6>2021-09-20T06:52:30.662562+00:00 sdc001 kernel: [5965963.263771] bond-migration: link status definitely down for interface eth4.2222, disabling it
<6>2021-09-20T06:52:30.662585+00:00 sdc001 kernel: [5965963.263774] bond-migration: making interface eth5.2222 the new active one
<6>2021-09-20T06:52:30.670568+00:00 sdc001 kernel: [5965963.271749] bond-glance: link status definitely down for interface eth4.2223, disabling it
<3>2021-09-20T06:52:32.600563+00:00 sdc001 kernel: [5965965.175504] ScaleIO netCon_IsKaNeeded:3761 :CON 00000000515dfcb3 didn't receive message for 30 iterations.  Marking as down
<3>2021-09-20T06:52:32.600587+00:00 sdc001 kernel: [5965965.186972] ScaleIO netCon_IsKaNeeded:3761 :CON 0000000030837167 didn't receive message for 30 iterations.  Marking as down
<3>2021-09-20T06:52:32.646130+00:00 sdc001 kernel: [5965965.251039] ScaleIO netCon_IsKaNeeded:3761 :CON 00000000c6b7b707 didn't receive message for 30 iterations.  Marking as down
<3>2021-09-20T06:52:32.657522+00:00 sdc001 kernel: [5965965.251092] [5786457902] Disconnected from SDS with ID 2b16b44c00000001  < ======================================================= unexpected
(...)
<3>2021-09-20T06:52:52.894622+00:00 sdc001: [5965985.494552] ScaleIO mapVolIO_ReportIOErrorIfNeeded:491 :[23145851856] IO-ERROR Type WRITE. comb: 24280000 0332. offsetInComb 1464872. SizeInLB 16. SDS_ID 2b16b44c00000001. Comb Gen 2c3f. Head Gen 2f1c. StartLB c793228.
<3>2021-09-20T06:52:52.894624+00:00 sdc001: [5965985.494555] ScaleIO mapVolIO_ReportIOErrorIfNeeded:512 :Vol ID 0x587d75290000000b. Last vol network error status NOT_CONN(4) Reason (ERROR) RC (ERROR) Retry count (20) chan (2)

 

問題

 アプリケーションにI/Oエラーが返されました。

Cause

この種のエラーは、ある種のネットワーク構成の誤りが原因で発生します。いずれかのコンポーネント(SDSまたはSDC)上のNICの1つが間違ったVLANに配置されている、まったく起動されていない、間違ったIPが割り当てられているなどです。 

この特定のケースでは、SDS「2b16b44c00000001」上のNICの1つが間違ったVLANに割り当てられていたため、事実上、SDC-SDS通信は単一のNICを介して行われていました。この接続がダウンすると、SDCはこのSDSと通信できなくなります。IPの役割が使用されていたため、このSDSは「SDSのみ」のNICを介してMDMや他のSDSに接続されたままになり、MDMがデータを再構築する理由がありませんでした。

Resolution

すべてのコンポーネントが想定どおりに接続されていることを確認します - 「netstat」コマンドまたはscliコマンド(正確なコマンドはPowerFlexのバージョンによって異なります)を使用して接続を確認します。

 

Affected Products

ScaleIO, PowerFlex Software

Products

VxFlex Product Family, VxFlex Ready Node
Article Properties
Article Number: 000193330
Article Type: Solution
Last Modified: 17 Apr 2025
Version:  3
Find answers to your questions from other Dell users
Support Services
Check if your device is covered by Support Services.