PowerStore: Es posible que el nodo se reinicie inesperadamente debido a una pérdida de memoria del controlador Linux
摘要: Un nodo puede restablecerse de manera inesperada debido a una pérdida de memoria dentro del espacio del kernel para la respuesta de Report LUN del SCSI de destino (SCST).
本文适用于
本文不适用于
本文并非针对某种特定的产品。
本文并非包含所有产品版本。
症状
Se observará que el sistema informa un exceso de mensajes, como los siguientes ejemplos:
El siguiente ejemplo sería un comando útil para comprobar la cantidad de estos mensajes:
Los indicios de falta de recursos pueden comenzar a aparecer en los registros:
Normalmente, se crea un archivo de volcado para este evento, pero no se requiere para el análisis de causa raíz (RCA). Consulte svc_dc list_dumps.
| svc_journalctl | grep "REPORT LUNS" Apr x 01:00:31 xxxxx-A kernel: scst: REPORT LUNS got, target='xx:xx:xx:xx:xx:xx:xx:xx', initiator='xx:xx:xx:xx:xx:xx:xx:xx' Apr x 01:00:31 xxxxx-B kernel: scst: REPORT LUNS got, target='xx:xx:xx:xx:xx:xx:xx:xx', initiator='xx:xx:xx:xx:xx:xx:xx:xx' Apr x 01:00:33 xxxxx-A kernel: scst: REPORT LUNS got, target='xx:xx:xx:xx:xx:xx:xx:xx', initiator='xx:xx:xx:xx:xx:xx:xx:xx' Apr x 01:00:34 xxxxx-B kernel: scst: REPORT LUNS got, target='xx:xx:xx:xx:xx:xx:xx:xx', initiator='xx:xx:xx:xx:xx:xx:xx:xx' Apr x 01:00:34 xxxxx-A kernel: scst: REPORT LUNS got, target='xx:xx:xx:xx:xx:xx:xx:xx', initiator='xx:xx:xx:xx:xx:xx:xx:xx' |
El siguiente ejemplo sería un comando útil para comprobar la cantidad de estos mensajes:
| svc_journalctl --since="today" | grep -c "REPORT LUNS" 44835 |
Los indicios de falta de recursos pueden comenzar a aparecer en los registros:
| svc_journalctl--since="today" | grep -i starved Apr x 01:47:58.501672 xxxx-A xtremapp[22524]: Apr x 01:47:58.500331 M [log_id:22772][3840(3891 nb_truck_0_sym 0x7fa0ffc20d00)]sym_ham_nbt_timer:1284: ====+ HAM: SYM NBT was starved for 550906 us (the threshold is 500000) #STARV Apr x 03:14:00.770872 xxxx-A xtremapp[22524]: Apr x 03:14:00.745703 M [log_id:22772][3840(3891 nb_truck_0_sym 0x7fa0ffc20d00)]sym_ham_nbt_timer:1284: ====+ HAM: SYM NBT was starved for 518854 us (the threshold is 500000) #STARV Apr x 04:35:39.509945 xxxx-A xtremapp[22524]: Apr x 04:35:39.507440 M [log_id:22772][3840(3891 nb_truck_0_sym 0x7fa0ffc20d00)]sym_ham_nbt_timer:1284: ====+ HAM: SYM NBT was starved for 523371 us (the threshold is 500000) #STARV |
Normalmente, se crea un archivo de volcado para este evento, pero no se requiere para el análisis de causa raíz (RCA). Consulte svc_dc list_dumps.
原因
Este problema se produce debido a una pérdida de memoria dentro del espacio del kernel para SCST debido a un uso excesivo del comando “Report LUN” desde ESXi. Esto puede provocar un retraso en la comunicación keepalive entre los nodos, lo cual desencadena un restablecimiento de nodos.
解决方案
Este problema se resuelve en PowerStoreOS 1.0.4.0.5.006 (v1 SP 4.1).
La corrección se indica en las notas de la versión en MDT-261192: Un nodo se puede reiniciar inesperadamente debido a una pérdida de memoria en un controlador Linux.
La corrección se indica en las notas de la versión en MDT-261192: Un nodo se puede reiniciar inesperadamente debido a una pérdida de memoria en un controlador Linux.
受影响的产品
PowerStore, PowerStore 1000X, PowerStore 1000T, PowerStore 3000X, PowerStore 3000T, PowerStore 5000X, PowerStore 5000T, PowerStore 7000X, PowerStore 7000T, PowerStore 9000T产品
PowerStore 9000X文章属性
文章编号: 000185532
文章类型: Solution
上次修改时间: 04 11月 2021
版本: 5
从其他戴尔用户那里查找问题的答案
支持服务
检查您的设备是否在支持服务涵盖的范围内。