SDC PowerFlex mają błędy we/wy po dodaniu nowego SDS do klastra

Summary: Po dodaniu nowego serwera SDS do klastra PowerFlex i przywróceniu równowagi danych w nowym serwerze SDS niektóre SDC wykazują błędy we/wy

This article applies to This article does not apply to This article is not tied to any specific product. Not all product versions are identified in this article.

Check out other resources

Symptoms

- Do klastra dodano SDS (ze zdarzeń MDM)

2022-03-07 18:28:07.080 MDM_CLI_CONF_COMMAND_RECEIVED INFO     	 Command add_sds received, User: 'admin'. [4576114] protection_domain with ID a876543f00000000, fault_set N/A, 

New SDS name: sds12, Hostnames: 172.1.0.12, Port: 7072
2022-03-07 18:28:07.324 CLI_COMMAND_SUCCEEDED         INFO     	 Command add_sds succeeded. [4576114] ID: 7d120650000002f

- Dzienniki SDC pokazują ślady stosu jądra podczas próby nawiązania połączenia z nowym SDS. Mogą one być wyświetlane wiele razy, gdy klient SDC próbuje połączyć się z nowym serwerem SDS:

022-03-07T18:29:02.880040-05:00 sdc32 kernel: net_sched: page allocation failure: order:4, mode:0x104020
2022-03-07T18:29:02.880170-05:00 sdc32 kernel: CPU: 16 PID: 5662 Comm: net_sched Kdump: loaded Tainted: P           OE  ------------   3.10.0-1062.el7.x86_64 #1
2022-03-07T18:29:02.880242-05:00 sdc32 kernel: Hardware name: Dell Inc. PowerEdge R740xd/5XXXXX, BIOS 2.4.8 11/26/2019
2022-03-07T18:29:02.880355-05:00 sdc32 kernel: Call Trace:
2022-03-07T18:29:02.880453-05:00 sdc32 kernel: [<ffffffffbb179262>] dump_stack+0x19/0x1b
2022-03-07T18:29:02.880553-05:00 sdc32 kernel: [<ffffffffbabc23d0>] warn_alloc_failed+0x110/0x180
2022-03-07T18:29:02.880623-05:00 sdc32 kernel: [<ffffffffbb1747fc>] __alloc_pages_slowpath+0x6b6/0x724
2022-03-07T18:29:02.880709-05:00 sdc32 kernel: [<ffffffffc09c021e>] ? netAddress_ToStrCopy+0x2de/0x520 [scini]
2022-03-07T18:29:02.880787-05:00 sdc32 kernel: [<ffffffffbabc6b84>] __alloc_pages_nodemask+0x404/0x420
2022-03-07T18:29:02.880851-05:00 sdc32 kernel: [<ffffffffbac14c68>] alloc_pages_current+0x98/0x110
2022-03-07T18:29:02.880922-05:00 sdc32 kernel: [<ffffffffbabc117e>] __get_free_pages+0xe/0x40
2022-03-07T18:29:02.880995-05:00 sdc32 kernel: [<ffffffffbac2052e>] kmalloc_order_trace+0x2e/0xa0
2022-03-07T18:29:02.881053-05:00 sdc32 kernel: [<ffffffffbac24571>] __kmalloc+0x211/0x230
2022-03-07T18:29:02.881110-05:00 sdc32 kernel: [<ffffffffc0988274>] mapClass_AllocAndInitObj+0x44/0x140 [scini]
2022-03-07T18:29:02.881167-05:00 sdc32 kernel: [<ffffffffc098959e>] mapClass_UpdateAll+0x40e/0x9b0 [scini]
2022-03-07T18:29:02.881229-05:00 sdc32 kernel: [<ffffffffc09c9994>] ? mosMitSchedThrd_CurThrdOurs+0x64/0x90 [scini]
2022-03-07T18:29:02.881298-05:00 sdc32 kernel: [<ffffffffc099aa07>] mapMdm_HandleObjUpdate_CK+0x327/0x730 [scini]
2022-03-07T18:29:02.881360-05:00 sdc32 kernel: [<ffffffffc099c070>] ? mapMdm_SendUpdateReq_CK+0xf0/0xed0 [scini]
2022-03-07T18:29:02.881419-05:00 sdc32 kernel: [<ffffffffc099c4b0>] mapMdm_SendUpdateReq_CK+0x530/0xed0 [scini]
2022-03-07T18:29:02.881480-05:00 sdc32 kernel: [<ffffffffc09a704f>] ? netSock_DoIO+0xef/0x7d0 [scini]
2022-03-07T18:29:02.881543-05:00 sdc32 kernel: [<ffffffffc09aaf47>] ? netChanThrottler_TryToWakeupWaiterOfCond+0x27/0x100 [scini]
2022-03-07T18:29:02.881606-05:00 sdc32 kernel: [<ffffffffc09ab118>] ? netChanThrottler_TryToWakeupWaiter+0x58/0x80 [scini]
2022-03-07T18:29:02.881660-05:00 sdc32 kernel: [<ffffffffc095cc80>] ? netChan_SendReq_CK+0x90/0xa70 [scini]
2022-03-07T18:29:02.881716-05:00 sdc32 kernel: [<ffffffffc095cdd0>] netChan_SendReq_CK+0x1e0/0xa70 [scini]
2022-03-07T18:29:02.881775-05:00 sdc32 kernel: [<ffffffffc09699c5>] netCon_SendReq_CK+0x175/0x590 [scini]
2022-03-07T18:29:02.881835-05:00 sdc32 kernel: [<ffffffffc0963cf7>] ? netRPC_SendDone_CK+0x47/0xab0 [scini]
2022-03-07T18:29:02.881890-05:00 sdc32 kernel: [<ffffffffc0963dd3>] netRPC_SendDone_CK+0x123/0xab0 [scini]
2022-03-07T18:29:02.881959-05:00 sdc32 kernel: [<ffffffffc09c9c24>] mosMit_RunWithTLS+0x54/0x60 [scini]
2022-03-07T18:29:02.882017-05:00 sdc32 kernel: [<ffffffffc09cbb92>] mosMitSchedThrd_ThrdEntry+0x1a2/0x500 [scini]
2022-03-07T18:29:02.882071-05:00 sdc32 kernel: [<ffffffffc09c82f0>] ? mosTicks_DestroyEnvSpecific+0x10/0x10 [scini]
2022-03-07T18:29:02.882126-05:00 sdc32 kernel: [<ffffffffc09c8310>] mosOsThrd_Entry+0x20/0x50 [scini]
2022-03-07T18:29:02.882185-05:00 sdc32 kernel: [<ffffffffbaac50d1>] kthread+0xd1/0xe0
2022-03-07T18:29:02.882240-05:00 sdc32 kernel: [<ffffffffbaac5000>] ? insert_kthread_work+0x40/0x40
2022-03-07T18:29:02.882294-05:00 sdc32 kernel: [<ffffffffbb18bd37>] ret_from_fork_nospec_begin+0x21/0x21
2022-03-07T18:29:02.882351-05:00 sdc32 kernel: [<ffffffffbaac5000>] ? insert_kthread_work+0x40/0x40
2022-03-07T18:29:02.891431-05:00 sdc32 kernel: ScaleIO mapClass_AllocAndInitObj:1301 :Error: Failed to allocate memory 38480.Cannot process MDM response

- Dzienniki SDC pokazują błędy we/wy:

2022-03-07T18:49:03.652009-05:00 sdc32 kernel: ScaleIO mapMultiHead_UpdateInPlace:561 :Warning: Invalid primaryTgtIdx 47 at 2. Multi-head ID dd990042.
2022-03-07T18:49:03.652130-05:00 sdc32 kernel: ScaleIO mapClass_UpdateAll:614 :Error: Object ffff948c7f350000 (class multi_head) failed to update in place.status NO_RESOURCES (67)
2022-03-07T18:49:04.662144-05:00 sdc32 kernel: ScaleIO mapVolIO_ReportIOErrorIfNeeded:491 :[67641433832] IO-ERROR Type READ. comb: 6ecc80210154. offsetInComb 14536800. SizeInLB 256. SDS_ID 7dd0d24700000033. Comb Gen 21c1. Head Gen 222c. StartLB 5fb1ac860.
2022-03-07T18:49:04.662268-05:00 sdc32 kernel: blk_update_request: I/O error, dev scinic, sector 25687672672

Wpływ

Błędy we/wy niektórych SDC

Cause

System operacyjny hosta, w którym działa SDC, nie ma ciągłych fragmentów pamięci w zakresie 64 KB. "Błąd alokacji strony: kolejność: 4" informuje, że jest to fragment o rozmiarze 64 KB, który jest niedostępny. Klient SDC prosi system operacyjny o przydział pamięci w celu utworzenia nowego gniazda i nawiązania połączenia z nowo dodanym serwerem SDS, co kończy się niepowodzeniem. Jeśli klient SDC nie może połączyć się z nowym serwerem SDS, a dane zostaną ponownie zrównoważone na nowym serwerze SDS, wystąpią błędy we/wy na hoście SDC.

Resolution

Błędy we/wy można natychmiast zatrzymać, przełączając nowy serwer SDS w tryb natychmiastowej konserwacji. Klienci SDC mogą pobierać swoje dane z pozostałych serwerów SDS. Po rozwiązaniu problemu z pamięcią SDC wyłącz konserwację serwera SDS.

Jest tu kilka rzeczy do zrobienia, wszystkie powinny być brane pod uwagę w planie działania:

Jeśli do rozwiązania tego problemu potrzebna jest pewna metoda, ponowne uruchomienie hosta SDC rozwiązuje problem. Powoduje ponowne zainicjowanie systemu operacyjnego, a fragmentacja pamięci, która była tam wcześniej, zniknie
Jeśli ponowne uruchomienie komputera nie jest możliwe, użyj następującego polecenia. Próbuje odzyskać i zagęścić pofragmentowaną pamięć tak bardzo, jak to możliwe. Nie ma gwarancji, że to zadziała i może zakłócać działanie bieżących aplikacji przez kilka sekund, gdy odzyskuje/kompaktuje fragmenty pamięci:
```
sync; echo 1 > /proc/sys/vm/drop_caches; echo 1 > /proc/sys/vm/compact_memory
```
Sprawdź użycie pamięci za pomocą "cat /proc/buddyinfo", aby zobaczyć, czy powyższe polecenie pomogło, czy nie. Użyj go przed i po uruchomieniu powyższego polecenia, aby sprawdzić, czy wzrośnie powyżej zera. Przyjrzymy się czwartej kolumnie w wierszu "Node 0, zone Normal", która oznacza liczbę 64 KB ciągłych fragmentów pamięci. W tym przypadku przed uruchomieniem powyższego polecenia w celu odzyskania/skompaktowania wyświetla się:
```
sdc32:~ # cat /proc/buddyinfo
Node 0, zone      DMA        1        0       0      1      2      1      1      0      1      1      2
Node 0, zone    DMA32        9        5       7      5      9      6      8      6      7      5    295
Node 0, zone   Normal   909921  1263646  202478      0<===  0      0      0      0      0      0      0
Node 1, zone   Normal	 39085	      0	      0      0      0      0      0      0      0      0      0
```
Sprawdź ustawienia nadmiernego commcommitowania pamięci w jądrze za pomocą polecenia "sysctl -a". Jeśli jądro używa wartości domyślnej w następujący sposób:
vm.overcommit_memory = 0
vm.overcommit_ratio = 50

Korzystne byłoby porozmawiać z dostawcą systemu operacyjnego o zmianie tych parametrów w następujący sposób, aby zapewnić systemowi operacyjnemu więcej pamięci do pracy po ponownym uruchomieniu i uniknąć tego problemu w przyszłości:
vm.overcommit_memory = 2
vm.overcommit_ratio = 98
Jądro Linuksa może wymagać aktualizacji, jeśli stanie się to regularnym wzorcem fragmentacji pamięci systemu operacyjnego

Wersje, których dotyczy problem

Problemy z fragmentacją pamięci systemu operacyjnego mogą mieć wpływ na wszystkie SDC PowerFlex.

Affected Products

PowerFlex Software

Article Number: 000197199

Article Type: Solution

Last Modified: 09 Jun 2025

Version: 2

Check if your device is covered by Support Services.

SDC PowerFlex mają błędy we/wy po dodaniu nowego SDS do klastra

Summary: Po dodaniu nowego serwera SDS do klastra PowerFlex i przywróceniu równowagi danych w nowym serwerze SDS niektóre SDC wykazują błędy we/wy

Symptoms

Cause

Resolution

Affected Products

Article Properties

Find answers to your questions from other Dell users

Support Services

Article Properties

Find answers to your questions from other Dell users

Support Services

SDC PowerFlex mają błędy we/wy po dodaniu nowego SDS do klastra

Summary: Po dodaniu nowego serwera SDS do klastra PowerFlex i przywróceniu równowagi danych w nowym serwerze SDS niektóre SDC wykazują błędy we/wy

Detailed Article

Symptoms

Cause

Resolution

Affected Products

Symptoms

Cause

Resolution

Affected Products

Article Properties

Find answers to your questions from other Dell users

Support Services

Article Properties

Find answers to your questions from other Dell users

Support Services