Data Domain: Rozwiązywanie problemów z pamięcią

Summary: W tym artykule bazy wiedzy opisano sposób rozwiązywania problemów z alertami pamięci, w tym sposób identyfikowania wadliwego modułu DIMM, który wymaga wymiany.

Ez a cikk a következő(k)re vonatkozik: Ez a cikk nem vonatkozik a következő(k)re: Ez a cikk nem kapcsolódik egyetlen konkrét termékhez sem. Ez a cikk nem azonosítja az összes termékverziót.

Symptoms

W tym artykule bazy wiedzy opisano sposób rozwiązywania problemów z alertami pamięci, w tym sposób identyfikowania wadliwego modułu DIMM, który wymaga wymiany.

Możliwe objawy / alerty:
 

DIMM-00001: Correctable ECC logging limit reached
DIMM-00002: Multibit Uncorrectable ECC error
DIMM-00003: A memory card has failed
ENVIRONMENT-00009: Memory correctable ECC errors exceed warning threshold
ENVIRONMENT-00013: Memory uncorrectable ECC error alert. 
ENVIRONMENT-00044: Memory riser fault has been detected
MEM-00001: DIMM failure detected after install. DDFS ""will not be started.
MEM-00002: Memory size(nnnnnnnnKB) goes below the configured size(nnnnnnnnKB)

*These may also be reported without the hyphen (-): e.g.
DIMM00001, DIMM00002, DIMM00003, ENVIRONMENT00009, ENVIRONMENT00013, ENVIRONMENT00044, MEM00001, MEM00002
  • Ponowne uruchomienie modułu alarmowego IPMI
  • Alert o mniejszej ilości pamięci niż oczekiwany
  • Możliwe zawieszenie się podczas autotestu po włączeniu (POST)
  • System nie uruchamia się lub ulega awarii

Cause

Moduły DIMM zainstalowane w systemach Datadomain mają kod "ECC" (Error Checking Code), który umożliwia naprawianie usuwalnych błędów pamięci w trakcie pracy. W przypadku przekroczenia progu błędów DDOS zgłasza usterkę i moduł DIMM, którego dotyczy problem, należy wymienić.
Niemożliwe do naprawienia błędy pamięci mogą spowodować ponowne uruchomienie systemu i są uważane za usterkę pamięci twardej.
Całkowita awaria pojedynczego modułu DIMM lub karty rozszerzeń pamięci (mieści wiele modułów DIMM) może spowodować awarię systemu i uniemożliwić włączenie systemu plików. Dzieje się tak, ponieważ proces DD Filesystem (DDFS) wypełnia większość pamięci fizycznej.

NUTA: Błędy pamięci mogą być maskowane przez inne objawy lub alerty — na przykład błąd sprawdzania procesora — może być wymagana głębsza analiza dziennika i rozwiązywanie problemów.

Resolution

Raportowanie błędów modułów DIMM jest śledzone we wszystkich wersjach DDOS. Jednak w celu zidentyfikowania konkretnego modułu DIMM, który uległ awarii, może być konieczna analiza dzienników systemowych.
Uwaga: Moduł DIMM może znajdować się w karcie nośnej pamięci podłączonej do płyty głównej.
         Aby system plików Data Domain (DDFS) mógł być włączony, CAŁA zainstalowana pamięć musi być obecna i funkcjonalna.

Rozwiązywanie problemów może obejmować:

  • Diagnostyka offline  
  • Analiza pliku dziennika
  • Ponowne umieszczanie podejrzanych modułów DIMM
  • Przenoszenie podejrzanych modułów DIMM do "znanych dobrych" gniazd (tj. czy błąd jest związany z modułem DIMM, gniazdem, kanałem lub kontrolerem?)
  • Wymiana uszkodzonego modułu DIMM lub risera (odpowiednio)  
  • Ciągłe monitorowanie w celu potwierdzenia stabilności systemu po zmianach lub wymianach sprzętu

Uwaga: Jeśli problem nie ustąpi po wykonaniu czynności opisanych w tym artykule bazy wiedzy, skontaktuj się z dostawcą pomocy technicznej lub utwórz zgłoszenie serwisowe .

Additional Information

Érintett termékek

Data Domain, PowerProtect Data Protection Appliance, Data Domain, Data Domain Deduplication Storage Systems, PowerProtect Data Protection Hardware
Termék tulajdonságai
Article Number: 000034334
Article Type: Solution
Utoljára módosítva: 17 ápr. 2026
Version:  8
Választ kaphat kérdéseire más Dell-felhasználóktól
Támogatási szolgáltatások
Ellenőrizze, hogy a készüléke rendelkezik-e támogatási szolgáltatással.