Data Domain: Rozwiązywanie problemów z pamięcią
Summary: W tym artykule bazy wiedzy opisano sposób rozwiązywania problemów z alertami pamięci, w tym sposób identyfikowania wadliwego modułu DIMM, który wymaga wymiany.
Symptoms
W tym artykule bazy wiedzy opisano sposób rozwiązywania problemów z alertami pamięci, w tym sposób identyfikowania wadliwego modułu DIMM, który wymaga wymiany.
Możliwe objawy / alerty:
DIMM-00001: Correctable ECC logging limit reached DIMM-00002: Multibit Uncorrectable ECC error DIMM-00003: A memory card has failed ENVIRONMENT-00009: Memory correctable ECC errors exceed warning threshold ENVIRONMENT-00013: Memory uncorrectable ECC error alert. ENVIRONMENT-00044: Memory riser fault has been detected MEM-00001: DIMM failure detected after install. DDFS ""will not be started. MEM-00002: Memory size(nnnnnnnnKB) goes below the configured size(nnnnnnnnKB)
*These may also be reported without the hyphen (-): e.g.
DIMM00001, DIMM00002, DIMM00003, ENVIRONMENT00009, ENVIRONMENT00013, ENVIRONMENT00044, MEM00001, MEM00002
- Ponowne uruchomienie modułu alarmowego IPMI
- Alert o mniejszej ilości pamięci niż oczekiwany
- Możliwe zawieszenie się podczas autotestu po włączeniu (POST)
- System nie uruchamia się lub ulega awarii
Cause
Niemożliwe do naprawienia błędy pamięci mogą spowodować ponowne uruchomienie systemu i są uważane za usterkę pamięci twardej.
Całkowita awaria pojedynczego modułu DIMM lub karty rozszerzeń pamięci (mieści wiele modułów DIMM) może spowodować awarię systemu i uniemożliwić włączenie systemu plików. Dzieje się tak, ponieważ proces DD Filesystem (DDFS) wypełnia większość pamięci fizycznej.
NUTA: Błędy pamięci mogą być maskowane przez inne objawy lub alerty — na przykład błąd sprawdzania procesora — może być wymagana głębsza analiza dziennika i rozwiązywanie problemów.
Resolution
Raportowanie błędów modułów DIMM jest śledzone we wszystkich wersjach DDOS. Jednak w celu zidentyfikowania konkretnego modułu DIMM, który uległ awarii, może być konieczna analiza dzienników systemowych.
Uwaga: Moduł DIMM może znajdować się w karcie nośnej pamięci podłączonej do płyty głównej.
Aby system plików Data Domain (DDFS) mógł być włączony, CAŁA zainstalowana pamięć musi być obecna i funkcjonalna.
Rozwiązywanie problemów może obejmować:
- Diagnostyka offline
- Analiza pliku dziennika
- Ponowne umieszczanie podejrzanych modułów DIMM
- Przenoszenie podejrzanych modułów DIMM do "znanych dobrych" gniazd (tj. czy błąd jest związany z modułem DIMM, gniazdem, kanałem lub kontrolerem?)
- Zapoznaj się z przewodnikiem po testach wymiany Dell Data Domain: Awaria karty pamięci lub modułu DIMM
- Wymiana uszkodzonego modułu DIMM lub risera (odpowiednio)
- Ciągłe monitorowanie w celu potwierdzenia stabilności systemu po zmianach lub wymianach sprzętu
Uwaga: Jeśli problem nie ustąpi po wykonaniu czynności opisanych w tym artykule bazy wiedzy, skontaktuj się z dostawcą pomocy technicznej lub utwórz zgłoszenie serwisowe .
Additional Information
Odwołania:
- Zapoznaj się z odpowiednimi podręcznikami sprzętowymi systemu DD dotyczącymi konfiguracji/układu
DIMM — Data Domain: Wymagania systemowe dotyczące pamięci i rozszerzone konfiguracje pamięci masowej
- Domena danych: Karta pamięci | Błąd modułu DIMM — błąd lub awaria
modułu DIMM — Data Domain: Awaria karty pamięci lub modułu DIMM