ECS: Nieoczekiwany ponowny rozruch z powodu NMI otrzymanego na procesorze

Summary: Nieoczekiwany ponowny rozruch z powodu otrzymania NMI na procesorze.

This article applies to This article does not apply to This article is not tied to any specific product. Not all product versions are identified in this article.

Symptoms

Węzeł ECS wielokrotnie nieoczekiwanie uruchamiał się ponownie, po ponownym uruchomieniu został wygenerowany plik rdzenia. Sprawdzając ślad stosu w dzienniku dmesg w /var/crash/, ponowne uruchomienie było spowodowane wykryciem NMI na procesorze.

Standardy NMI dla niemaskowalnych przerwań, które są przerwami o najwyższym priorytecie, występuje w celu zasygnalizowania uwagi na nieodwracalne błędy sprzętowe.

2020-03-01-21:06/dmesg.txt:[5200025.129135] Uhhuh. NMI received for unknown reason 3d on CPU 0. 2020-03-01-21:06/dmesg.txt-[5200025.129135] Do you have a strange power-saving mode enabled? Checked the hardware for any issue and checked if BIOS is out-dated sudo bash memory.sh sudo ipmitool sel list sudo xdoctor /usr/share/emc-intel-firmware/flashupdt/flashupdt /i | grep "BIOS Version"

Cause

Może to być problem z systemem operacyjnym lub sprzętem.

Resolution

Ponowne tworzenie obrazu może być wystarczające. Jednak prawdopodobnie najlepszym rozwiązaniem jest fizyczna wymiana węzła, jeśli problem nie ustąpi po ponownym zobrazowaniu.

Affected Products

Elastic Cloud Storage

Products

Elastic Cloud Storage
Article Properties
Article Number: 000081969
Article Type: Solution
Last Modified: 12 Sep 2025
Version:  5
Find answers to your questions from other Dell users
Support Services
Check if your device is covered by Support Services.