PowerEdge: Jakie są komunikaty o błędach dotyczące obudowy M1000e?

Podsumowanie: Częściowa lista komunikatów o błędach obudowy M1000e, ich istotności i potencjalnych przyczyn

Ten artykuł dotyczy Ten artykuł nie dotyczy Ten artykuł nie jest powiązany z żadnym konkretnym produktem. Nie wszystkie wersje produktu zostały zidentyfikowane w tym artykule.

Instrukcje


W przypadku napotkania problemu w obudowie kasetowej PowerEdge M1000e na ekranie LCD lub w dziennikach zdarzeń systemowych kontrolera Chassis Management Controller (CMC) jest wyświetlany komunikat o błędzie.

W poniższych tabelach przedstawiono możliwe komunikaty o błędach i ich przyczyny, dzięki czemu można naprawić błąd i usunąć komunikat.

 

Komunikaty o błędach dotyczące ekranu stanu kontrolera CMC

 

Stopień ważności

Komunikat o błędzie

Powód

Krytyczny

Numer> CMC <Bateria: Potwierdzono awarię czujnika baterii dla CMC.

Brak baterii w pamięci CMOS kontrolera CMC lub brak napięcia.

Krytyczny

Numer> CMC <Temperatura procesora: Czujnik temperatury w przypadku awarii CMC

Temperatura procesora kontrolera CMC przekroczyła próg krytyczny.

Krytyczny

Liczba> CMC <Temperatura otoczenia: Czujnik temperatury w przypadku awarii CMC

Temperatura otoczenia kontrolera CMC przekroczyła próg krytyczny.


          

Komunikaty o błędach dotyczące stanu osłony/obudowy

 

Stopień ważności

Komunikat o błędzie

Powód

Krytyczny

Liczba> wentylatorów <na obudowie: Czujnik wentylatora dla urządzenia wentylatora obudowy został usunięty.

Wyjęty wentylator jest wymagany do prawidłowego chłodzenia osłony/obudowy.

Krytyczny

Redundancja zasilaczy: Czujnik redundancji PS dla zasilacza, stwierdzono utratę nadmiarowości.

Co najmniej jedna jednostka zasilacza uległa awarii lub została usunięta, więc system nie jest już nadmiarowy.

Krytyczny

Redundancja zasilaczy: Czujnik nadmiarowości PS zasilacza, nienadmiarowy: niewystarczające zasoby

Co najmniej jeden zasilacz uległ awarii lub został usunięty, a system nie posiada wystarczającej ilości energii, aby utrzymać normalne działanie. Serwery mogą się wyłączyć.

Krytyczny

Temperatura panelu sterowania: Czujnik temperatury dla Centrali, zdarzenie awarii

Temperatura osłony/obudowy przekroczyła próg krytyczny.

Krytyczny

Numer>CMC<Wersja autonomiczna: Czujnik mikrokontrolera CMC, nienadmiarowy.

Kontroler CMC nie jest już nadmiarowy. Ten komunikat jest wyświetlany tylko wtedy, gdy rezerwowy kontroler CMC został usunięty lub uległ awarii.

Krytyczny

Model CEL dziennika zdarzeń obudowy: Czujnik dziennika zdarzeń obudowy, wszystkie rejestrowanie zdarzeń zostało wyłączone.

Kontroler CMC nie może rejestrować zdarzeń, gdy czujnik rejestru zdarzeń jest wyłączony. Dziennik zdarzeń jest wyłączany po zapełnieniu. Czyszczenie dziennika ponownie włącza rejestrowanie zdarzeń.

Krytyczny

Model CEL dziennika zdarzeń obudowy: Czujnik dziennika zdarzeń dla dziennika zdarzeń obudowy, potwierdzono zapełnienie dziennika.

Urządzenie obudowy wykrywa, że przed jego zapełnieniem można dodać jeszcze tylko jeden wpis.

Ostrzeżenie

Model CEL dziennika zdarzeń obudowy: Czujnik dziennika zdarzeń dla dziennika zdarzeń obudowy, dziennik jest prawie pełny.

Dziennik zdarzeń obudowy jest pełny w 75%.

Ostrzeżenie

Redundancja zasilaczy: Czujnik nadmiarowości PS zasilacza, potwierdzono obniżenie nadmiarowości.

Co najmniej jeden zasilacz uległ awarii lub został usunięty, system nie może już obsługiwać pełnej nadmiarowości zasilacza.

 

Komunikaty o błędach dotyczące ekranu stanu wentylatora

 

Stopień ważności

Komunikat o błędzie

Powód

Krytyczny

Numer wentylatora <> obudowy Status: Czujnik wentylatora obudowy Zdarzenie awarii wentylatora.

Prędkość określonego wentylatora nie wystarcza do zapewnienia wystarczającego chłodzenia systemu.


 

Komunikaty o błędach dotyczące ekranu stanu kontrolera IOM

 

Stopień ważności

Komunikat o błędzie

Powód

Krytyczny

Numer modułu <> we/wy Status: Czujnik modułu dla modułu I/O, potwierdzono przejście do krytycznego z mniej poważnego.

W module we/wy wystąpił błąd. Ten sam błąd może wystąpić także wtedy, gdy moduł we/wy jest wyzwolony termicznie.

Ostrzeżenie

Numer modułu <> we/wy Status: Czujnik modułu we/wy, przejście z OK do stanu niekrytycznego.

W module we/wy wystąpiła niezgodność sieci lub dostrojenia linku.

 

Komunikaty o błędach na ekranie stanu iKVM

 

Stopień ważności

Komunikat o błędzie

Powód

Nieodzyskiwalne

Kondycja lokalnego przełącznika KVM: Czujnik modułu dla lokalnego KVM, przejście do stanu nieodwracalnego.

Wystąpiła awaria mikroukładu szeregowego RIP lub USB hosta.

 

Krytyczny

Kondycja lokalnego przełącznika KVM: Czujnik modułu dla lokalnego KVM, zapewniono przejście z krytycznego z mniej poważnego.

Wystąpiła awaria wyliczania hosta USB lub OSCAR.

Ostrzeżenie

Kondycja lokalnego przełącznika KVM: Czujnik modułu dla lokalnego KVM, przejście z OK do stanu niekrytycznego.

Wystąpiła niewielka awaria, np. uszkodzone oprogramowanie wewnętrzne.

 

Komunikaty o błędach dotyczące ekranu stanu kontrolera PSU

 

Stopień ważności

Komunikat

Powód

Krytyczny

Numer zasilacza<>: Wykryto awarię czujnika zasilacza.

Nastąpiła awaria zasilacza.

Krytyczny

Numer zasilacza<>: Czujnik zasilania zasilacza, utracono dane wejściowe.

Przewód zasilania prądem zmiennym został odłączony od zasilania lub nastąpiła utrata zasilania prądem zmiennym.

 

Ekran stanu serwera komunikaty o błędach dla serwerów kasetowych M1000e

 

Stopień ważności

Komunikat o błędzie

Powód

Ostrzeżenie

Temperatura otoczenia płyty głównej: Czujnik temperatury płyty głównej, zdarzenie ostrzegawcze

Temperatura w otoczeniu serwera przekroczyła próg ostrzeżenia.

Krytyczny

 

Temperatura otoczenia płyty głównej: Czujnik temperatury płyty głównej, zdarzenie awarii

 

Temperatura w otoczeniu serwera przekroczyła próg awarii.

Krytyczny

Bateria CMOS płyty głównej: Potwierdzono awarię czujnika baterii płyty głównej.

Bateria CMOS nie jest obecna lub nie ma napięcia.

 

Ostrzeżenie

Monitor prądu na płycie głównej: Czujnik prądu na płycie głównej, zdarzenie ostrzegawcze

 

Natężenie prądu przekroczyło próg ostrzeżenia.

Krytyczny

Monitor prądu na płycie głównej: Czujnik prądu dla awarii płyty głównej

Natężenie prądu przekroczyło próg awarii.

Krytyczny

<Nazwa> czujnika napięcia: Czujnik napięcia płyty głównej, stan potwierdzony został potwierdzony.

Napięcie jest poza zakresem.

Krytyczny

 

Stan numeru> procesora<: Czujnik procesora dla numeru procesora<, potwierdzono IERR.

 

Nastąpiła awaria procesora.

Krytyczny

Stan numeru> procesora<: Czujnik procesora dla numeru> procesora<, potwierdzenie działania termicznego.

Procesor jest przegrzany.

Krytyczny

Stan numeru> procesora<: Czujnik procesora dla numeru procesora<, błąd konfiguracji został potwierdzony.

Procesor niewłaściwego typu lub w nieodpowiedniej lokalizacji.

Krytyczny

Stan numeru> procesora<: Czujnik procesora dla numeru> procesora<, obecność została wyłączona.

Niewłaściwy typ procesora lub jego brak.

Krytyczny

Karta karty wideo płyty głównej: Potwierdzono, że usunięto czujnik modułu dla urządzenia płyty głównej.

 

Wymagany moduł został usunięty.

 

Krytyczny

Status mezzanine B: Czujnik karty dodatkowej dla Mezz B, błąd instalacji został potwierdzony.

 

Dla sieci we/wy zainstalowano niewłaściwą kartę Mezzanine.

Krytyczny

Status mezzanine C: Czujnik karty dodatkowej dla Mezz C, błąd instalacji został potwierdzony.

Dla sieci we/wy zainstalowano niewłaściwą kartę Mezzanine.

Krytyczny


Numer> dysku <płyty backplane: Usunięto czujnik gniazda napędu płyty backplane

Usunięto dysk pamięci masowej.

Krytyczny


Numer> dysku <płyty backplane: Czujnik gniazda dysku płyty backplane, potwierdzono awarię dysku.

Awaria dysku pamięci masowej.

Krytyczny


Zabezpieczenie awaryjne w przypadku awarii płyty głównej: Czujnik napięcia płyty głównej, stan potwierdzony został potwierdzony.

Zdarzenie to jest generowane, gdy napięcie na płycie systemowej nie jest na normalnym poziomie.

Krytyczny


Watchdog systemu operacyjnego na płycie głównej: Wykryto czujnik alarmowy ponownego uruchomienia płyty głównej.

Układ zabezpieczający iDRAC wykrył, że system uległ awarii (upłynął limit czasu, ponieważ nie otrzymano odpowiedzi od hosta) i ponownie uruchomiono komputer.

Krytyczny


Watchdog systemu operacyjnego na płycie głównej: Czujnik alarmowy dla płyty głównej, wyłączono zasilanie.

Układ zabezpieczający iDRAC wykrył, że system uległ awarii (upłynął limit czasu, ponieważ nie otrzymano odpowiedzi od hosta), i wyłączono komputer.

Krytyczny


Watchdog systemu operacyjnego na płycie głównej: Wykryto czujnik alarmowy dla wyłączenia i włączenia zasilania płyty głównej.

Układ zabezpieczający iDRAC wykrył, że system uległ awarii (upłynął limit czasu, ponieważ nie otrzymano odpowiedzi od hosta) i wyłączono i ponownie włączono komputer.

Krytyczny


Numer płyty głównej: Czujnik dziennika zdarzeń płyty głównej, potwierdzono zapełnienie dziennika.

Urządzenie SEL wykryło, że do SEL można dodać jeszcze tylko jeden wpis przed jego zapełnieniem.

Ostrzeżenie


ECC Corr Err: Czujnik pamięci, potwierdzono możliwość korekcji ECC (<lokalizacja> DIMM).

Naprawialne błędy ECC osiągnęły wartość krytyczną.

Krytyczny


Błąd niecorr ECC: Czujnik pamięci, stwierdzono, że nie można naprawić funkcji ECC (<lokalizacja> modułu DIMM).

Wykryto nienaprawialny błąd ECC.

Krytyczny

Kanał we/wy Chk: Czujnik zdarzenia krytycznego, kontrola kanału we/wy Wykryto wartość NMI.

W kanale we/wy wygenerowano krytyczne przerwanie.

Krytyczny

Błąd parzystości PCI: Czujnik zdarzeń krytycznych, PCI PERR.

Na magistrali PCI wykryto błąd parzystości.

Krytyczny

Błąd systemu PCI: Czujnik zdarzeń krytycznych, potwierdzono PCI SERR (<numer gniazda lub identyfikator urządzenia PCI>).

Urządzenie wykryło błąd PCI.

Krytyczny

Dziennik SBE wyłączony: Czujnik dziennika zdarzeń, wyłączono rejestrowanie błędów pamięci z możliwością korekty.

Rejestrowanie jednobitowych błędów jest wyłączane w przypadku rejestracji zbyt wielu SBE.

Krytyczny

Rejestrowanie wyłączone: Czujnik dziennika zdarzeń, wszystkie rejestrowanie zdarzeń wyłączone.

Rejestrowanie wszystkich zdarzeń zostało wyłączone.

Nieodzyskiwalne

Błąd protokołu procesora: Czujnik procesora, przejście do stanu nieodwracalnego.

Protokół procesora wszedł w stan niemożliwy do odzyskania.

Nieodzyskiwalne

PERR magistrali CPU: Czujnik procesora, przejście do stanu nieodwracalnego.

Magistrala procesora PERR przeszła w stan niemożliwy do odzyskania.

Nieodzyskiwalne

Błąd inicjowania procesora: Czujnik procesora, przejście do stanu nieodwracalnego.

Inicjalizacja procesora przeszła w stan niemożliwy do odzyskania.

Nieodzyskiwalne

CPU Machine Chk: Czujnik procesora, przejście do stanu nieodwracalnego.

Moduł sprawdzania procesora przeszedł w stan niemożliwy do odzyskania.

Krytyczny


Pamięć zaoszczędzona: Potwierdzono utratę nadmiarowości czujnika pamięci (<lokalizacja> DIMM).

Pamięć zapasowa nie jest już nadmiarowa.

Krytyczny


Kopia lustrzana pamięci: Potwierdzono utratę nadmiarowości czujnika pamięci (<lokalizacja> DIMM).

Kopia lustrzana pamięci nie jest już nadmiarowa.

Krytyczny

Macierz RAID pamięci: Potwierdzono utratę nadmiarowości czujnika pamięci (<lokalizacja> DIMM).

Pamięć RAID nie jest już nadmiarowa.

Krytyczny

Błąd cfg pamięci: Błąd konfiguracji czujnika pamięci (<lokalizacja> modułu DIMM) został potwierdzony.

Konfiguracja pamięci nie jest poprawna dla systemu.

Ostrzeżenie


Wzmocnienie redun pamięci: Potwierdzono obniżenie nadmiarowości czujnika pamięci (<lokalizacja> DIMM).

Nadmiarowość pamięci uległa obniżeniu, ale nie została utracona.

Krytyczny

Błąd krytyczny PCIE: Wykryto błąd krytyczny czujnika zdarzenia krytycznego magistrali.

Na magistrali PCI wykryto błąd krytyczny.

Krytyczny

Błąd chipsetu: Czujnik zdarzeń krytycznych, PCI PERR.

Wykryto błąd układu scalonego.

Ostrzeżenie

Ostrzeżenie dotyczące funkcji ECC pamięci: Czujnik pamięci, przejście z OK (<lokalizacja> DIMM) na niekrytyczny.

Naprawialne błędy ECC przekroczyły normalną wartość.

Krytyczny

Ostrzeżenie dotyczące funkcji ECC pamięci: Czujnik pamięci, przejście z mniej poważnego z krytycznego (<lokalizacja> DIMM).

Naprawialne błędy ECC osiągnęły wartość krytyczną.

Krytyczny

Błąd podczas testu POST płyty głównej: Czujnik POST płyty głównej, błąd <krytyczny testu POST — uzyskano dodatkowe informacje o> błędzie.

Dodatkowe informacje na temat błędów testu POST systemu BIOS można znaleźć wpodręczniku użytkownika obudowy Dell PowerEdge M1000e.

Produkty, których dotyczy problem

PowerEdge M1000E
Właściwości artykułu
Numer artykułu: 000130128
Typ artykułu: How To
Ostatnia modyfikacja: 05 lut 2025
Wersja:  7
Znajdź odpowiedzi na swoje pytania u innych użytkowników produktów Dell
Usługi pomocy technicznej
Sprawdź, czy Twoje urządzenie jest objęte usługą pomocy technicznej.