PowerStore: Uzel se může neočekávaně restartovat kvůli nevrácení paměti v ovladači systému Linux

摘要: Uzel se může neočekávaně resetovat z důvodu nevrácení paměti v prostoru jádra pro odezvu hlášení jednotek LUN v rozhraní SCST (SCSI Target). ...

本文适用于 本文不适用于 本文并非针对某种特定的产品。 本文并非包含所有产品版本。

症状

Systém bude zobrazovat nadměrné množství zpráv jako:
svc_journalctl | grep "REPORT LUNS"

Apr x 01:00:31 xxxxx-A kernel: scst: REPORT LUNS got, target='xx:xx:xx:xx:xx:xx:xx:xx', initiator='xx:xx:xx:xx:xx:xx:xx:xx'
Apr x 01:00:31 xxxxx-B kernel: scst: REPORT LUNS got, target='xx:xx:xx:xx:xx:xx:xx:xx', initiator='xx:xx:xx:xx:xx:xx:xx:xx'
Apr x 01:00:33 xxxxx-A kernel: scst: REPORT LUNS got, target='xx:xx:xx:xx:xx:xx:xx:xx', initiator='xx:xx:xx:xx:xx:xx:xx:xx'
Apr x 01:00:34 xxxxx-B kernel: scst: REPORT LUNS got, target='xx:xx:xx:xx:xx:xx:xx:xx', initiator='xx:xx:xx:xx:xx:xx:xx:xx'
Apr x 01:00:34 xxxxx-A kernel: scst: REPORT LUNS got, target='xx:xx:xx:xx:xx:xx:xx:xx', initiator='xx:xx:xx:xx:xx:xx:xx:xx'

Užitečný příkaz ke kontrole počtu těchto zpráv je například:
svc_journalctl --since="today" | grep -c "REPORT LUNS"
44835

V protokolech se můžou začít zobrazovat příznaky vyčerpání:
svc_journalctl--since="today" grep -i starved

Apr x 01:47:58.501672 xxxx-A xtremapp[22524]: Apr x 01:47:58.500331 M [log_id:22772][3840(3891 nb_truck_0_sym   0x7fa0ffc20d00)]sym_ham_nbt_timer:1284: ====+ HAM: SYM NBT was starved for 550906 us (the threshold is 500000) #STARV
Apr x 03:14:00.770872 xxxx-A xtremapp[22524]: Apr x 03:14:00.745703 M [log_id:22772][3840(3891 nb_truck_0_sym   0x7fa0ffc20d00)]sym_ham_nbt_timer:1284: ====+ HAM: SYM NBT was starved for 518854 us (the threshold is 500000) #STARV
Apr x 04:35:39.509945 xxxx-A xtremapp[22524]: Apr x 04:35:39.507440 M [log_id:22772][3840(3891 nb_truck_0_sym   0x7fa0ffc20d00)]sym_ham_nbt_timer:1284: ====+ HAM: SYM NBT was starved for 523371 us (the threshold is 500000) #STARV


Pro tuto událost se obvykle vytvoří soubor výpisu, který však není vyžadován pro analýzu hlavní příčiny (RCA). Viz svc_dc list_dumps.

原因

K tomuto problému dochází z důvodu nevrácení paměti v jádru SCST způsobeného nadměrným množstvím příkazů „Report LUN“ ze systému ESXi. To může způsobit zpoždění v komunikaci keepalive mezi uzly a reset uzlu.

解决方案

Tento problém je vyřešen v systému PowerStoreOS 1.0.4.0.5.006 (V1 SP4.1).

Oprava je uvedena v poznámkách k verzi v části MDT-261192: Uzel se může neočekávaně restartovat kvůli nevrácení paměti v ovladači Linux.

受影响的产品

PowerStore, PowerStore 1000X, PowerStore 1000T, PowerStore 3000X, PowerStore 3000T, PowerStore 5000X, PowerStore 5000T, PowerStore 7000X, PowerStore 7000T, PowerStore 9000T

产品

PowerStore 9000X
文章属性
文章编号: 000185532
文章类型: Solution
上次修改时间: 04 11月 2021
版本:  5
从其他戴尔用户那里查找问题的答案
支持服务
检查您的设备是否在支持服务涵盖的范围内。