PowerStore: un nodo potrebbe riavviarsi in modo imprevisto in seguito a una perdita di memoria del driver Linux
摘要: Potrebbe verificarsi un reset imprevisto di un nodo a causa di una perdita di memoria nello spazio del kernel per la risposta al comando Report LUNs della destinazione SCSI (SCST).
本文适用于
本文不适用于
本文并非针对某种特定的产品。
本文并非包含所有产品版本。
症状
Verrà riscontrato che il sistema segnala un numero di messaggi eccessivo, ad esempio:
Un comando utile per verificare il numero di questi messaggi può essere ad esempio:
Nei log potrebbero iniziare a essere registrate indicazioni di scadenza:
Per questo evento viene in genere creato un dump file, che tuttavia non è richiesto per la Root-Cause Analysis (RCA). Consultare svc_dc list_dumps.
| svc_journalctl | grep "REPORT LUNS" Apr x 01:00:31 xxxxx-A kernel: scst: REPORT LUNS got, target='xx:xx:xx:xx:xx:xx:xx:xx', initiator='xx:xx:xx:xx:xx:xx:xx:xx' Apr x 01:00:31 xxxxx-B kernel: scst: REPORT LUNS got, target='xx:xx:xx:xx:xx:xx:xx:xx', initiator='xx:xx:xx:xx:xx:xx:xx:xx' Apr x 01:00:33 xxxxx-A kernel: scst: REPORT LUNS got, target='xx:xx:xx:xx:xx:xx:xx:xx', initiator='xx:xx:xx:xx:xx:xx:xx:xx' Apr x 01:00:34 xxxxx-B kernel: scst: REPORT LUNS got, target='xx:xx:xx:xx:xx:xx:xx:xx', initiator='xx:xx:xx:xx:xx:xx:xx:xx' Apr x 01:00:34 xxxxx-A kernel: scst: REPORT LUNS got, target='xx:xx:xx:xx:xx:xx:xx:xx', initiator='xx:xx:xx:xx:xx:xx:xx:xx' |
Un comando utile per verificare il numero di questi messaggi può essere ad esempio:
| svc_journalctl --since="today" | grep -c "REPORT LUNS" 44835 |
Nei log potrebbero iniziare a essere registrate indicazioni di scadenza:
| svc_journalctl--since="today" | grep -i starved Apr x 01:47:58.501672 xxxx-A xtremapp[22524]: Apr x 01:47:58.500331 M [log_id:22772][3840(3891 nb_truck_0_sym 0x7fa0ffc20d00)]sym_ham_nbt_timer:1284: ====+ HAM: SYM NBT was starved for 550906 us (the threshold is 500000) #STARV Apr x 03:14:00.770872 xxxx-A xtremapp[22524]: Apr x 03:14:00.745703 M [log_id:22772][3840(3891 nb_truck_0_sym 0x7fa0ffc20d00)]sym_ham_nbt_timer:1284: ====+ HAM: SYM NBT was starved for 518854 us (the threshold is 500000) #STARV Apr x 04:35:39.509945 xxxx-A xtremapp[22524]: Apr x 04:35:39.507440 M [log_id:22772][3840(3891 nb_truck_0_sym 0x7fa0ffc20d00)]sym_ham_nbt_timer:1284: ====+ HAM: SYM NBT was starved for 523371 us (the threshold is 500000) #STARV |
Per questo evento viene in genere creato un dump file, che tuttavia non è richiesto per la Root-Cause Analysis (RCA). Consultare svc_dc list_dumps.
原因
Questo problema si verifica a causa di una perdita di memoria nello spazio del kernel per SCST dovuta a un uso eccessivo del comando "Report LUN" da parte di ESXi. Ciò potrebbe causare un ritardo nelle comunicazioni keep-alive tra i nodi, attivando una reimpostazione dei nodi.
解决方案
Questo problema è stato risolto in PowerStoreOS 1.0.4.0.5.006 (v1 SP 4.1).
La correzione è elencata nelle note di rilascio in MDT-261192: Un nodo potrebbe riavviarsi in modo imprevisto a causa di una perdita di memoria del driver Linux.
La correzione è elencata nelle note di rilascio in MDT-261192: Un nodo potrebbe riavviarsi in modo imprevisto a causa di una perdita di memoria del driver Linux.
受影响的产品
PowerStore, PowerStore 1000X, PowerStore 1000T, PowerStore 3000X, PowerStore 3000T, PowerStore 5000X, PowerStore 5000T, PowerStore 7000X, PowerStore 7000T, PowerStore 9000T产品
PowerStore 9000X文章属性
文章编号: 000185532
文章类型: Solution
上次修改时间: 04 11月 2021
版本: 5
从其他戴尔用户那里查找问题的答案
支持服务
检查您的设备是否在支持服务涵盖的范围内。