단일 NIC에서 연결이 끊어진 후 PowerFlex SDC가 I/O 오류를 로깅함

Summary: PowerFlex용으로 여러 NIC가 구성된 시스템에서 단일 NIC 연결이 끊어지면 SDC가 애플리케이션에 I/O 오류를 반환할 수 있습니다.

This article applies to This article does not apply to This article is not tied to any specific product. Not all product versions are identified in this article.

Symptoms

시나리오
PowerFlex는 각 구성 요소에 대해 여러 연결을 사용합니다(예: SDS IP 역할이 "All"인 연결 2개 또는 연결 4개 - "SDS 전용"에 2개, "SDC 전용"에 2개).

이 문제는 단일 연결이 끊어지면(즉, 단일 스위치 재부팅, 단일 NIC 종료 등) 나타납니다.

시스템 전체에 DU(DATA_FAILED 용량)가 없습니다.

조짐
SDC는 여러 연결이 구성되어 있음에도 불구하고 단일(또는 그 이상)의 SDS에서 연결 해제를 보고합니다.

 <6>2021-09-20T06:52:29.617016+00:00 sdc001 kernel: [5965962.215707] bond-glance: link status down for backup interface eth4.2223, disabling it in 1000 ms
<6>2021-09-20T06:52:29.628748+00:00 sdc001 kernel: [5965962.227665] bond-glance: link status down for backup interface eth4.2223, disabling it in 1000 ms
<3>2021-09-20T06:52:29.628773+00:00 sdc001 kernel: [5965962.227668] bond-glance: invalid new link 1 on slave eth4.2223
<6>2021-09-20T06:52:30.638572+00:00 sdc001 kernel: [5965963.239669] bond-nfs: link status definitely down for interface eth4.2226, disabling it
<6>2021-09-20T06:52:30.662562+00:00 sdc001 kernel: [5965963.263771] bond-migration: link status definitely down for interface eth4.2222, disabling it
<6>2021-09-20T06:52:30.662585+00:00 sdc001 kernel: [5965963.263774] bond-migration: making interface eth5.2222 the new active one
<6>2021-09-20T06:52:30.670568+00:00 sdc001 kernel: [5965963.271749] bond-glance: link status definitely down for interface eth4.2223, disabling it
<3>2021-09-20T06:52:32.600563+00:00 sdc001 kernel: [5965965.175504] ScaleIO netCon_IsKaNeeded:3761 :CON 00000000515dfcb3 didn't receive message for 30 iterations.  Marking as down
<3>2021-09-20T06:52:32.600587+00:00 sdc001 kernel: [5965965.186972] ScaleIO netCon_IsKaNeeded:3761 :CON 0000000030837167 didn't receive message for 30 iterations.  Marking as down
<3>2021-09-20T06:52:32.646130+00:00 sdc001 kernel: [5965965.251039] ScaleIO netCon_IsKaNeeded:3761 :CON 00000000c6b7b707 didn't receive message for 30 iterations.  Marking as down
<3>2021-09-20T06:52:32.657522+00:00 sdc001 kernel: [5965965.251092] [5786457902] Disconnected from SDS with ID 2b16b44c00000001  < ======================================================= unexpected
(...)
<3>2021-09-20T06:52:52.894622+00:00 sdc001: [5965985.494552] ScaleIO mapVolIO_ReportIOErrorIfNeeded:491 :[23145851856] IO-ERROR Type WRITE. comb: 24280000 0332. offsetInComb 1464872. SizeInLB 16. SDS_ID 2b16b44c00000001. Comb Gen 2c3f. Head Gen 2f1c. StartLB c793228.
<3>2021-09-20T06:52:52.894624+00:00 sdc001: [5965985.494555] ScaleIO mapVolIO_ReportIOErrorIfNeeded:512 :Vol ID 0x587d75290000000b. Last vol network error status NOT_CONN(4) Reason (ERROR) RC (ERROR) Retry count (20) chan (2)

 

영향

 애플리케이션에 반환된 I/O 오류입니다.

Cause

이러한 종류의 오류는 구성 요소(SDS 또는 SDC)의 NIC 중 하나가 잘못된 VLAN에 배치되거나 전혀 표시되지 않거나 잘못된 IP가 할당되는 등의 잘못된 네트워크 구성에서 비롯됩니다. 

이 경우에는 SDS "2b16b44c00000001"의 NIC 중 하나가 잘못된 VLAN에 할당되어 단일 NIC를 통해 SDC-SDS 통신이 효과적으로 이루어지고 있었습니다. 연결이 끊어지면 SDC가 더 이상 이 SDS와 통신할 수 없었습니다. IP 역할이 사용 중이었기 때문에 이 SDS는 "SDS 전용" NIC를 통해 MDM 및 다른 SDS에 연결된 상태로 유지되므로 MDM이 데이터를 재구축할 이유가 없었습니다.

Resolution

모든 구성 요소가 예상대로 연결되었는지 확인합니다. 'netstat' 및/또는 scli 명령(정확한 명령은 PowerFlex 버전에 따라 다름)을 사용하여 연결을 확인합니다.

 

Affected Products

ScaleIO, PowerFlex Software

Products

VxFlex Product Family, VxFlex Ready Node
Article Properties
Article Number: 000193330
Article Type: Solution
Last Modified: 17 Apr 2025
Version:  3
Find answers to your questions from other Dell users
Support Services
Check if your device is covered by Support Services.