Data Domain: Rozwiązywanie problemów z pamięcią

Summary: W tym artykule bazy wiedzy opisano sposób rozwiązywania problemów z alertami pamięci, w tym sposób identyfikowania wadliwego modułu DIMM, który wymaga wymiany.

This article applies to This article does not apply to This article is not tied to any specific product. Not all product versions are identified in this article.

Symptoms

W tym artykule bazy wiedzy opisano sposób rozwiązywania problemów z alertami pamięci, w tym sposób identyfikowania wadliwego modułu DIMM, który wymaga wymiany.

Możliwe objawy / alerty:
 

DIMM-00001: Correctable ECC logging limit reached
DIMM-00002: Multibit Uncorrectable ECC error
DIMM-00003: A memory card has failed
ENVIRONMENT-00009: Memory correctable ECC errors exceed warning threshold
ENVIRONMENT-00013: Memory uncorrectable ECC error alert. 
ENVIRONMENT-00044: Memory riser fault has been detected
MEM-00001: DIMM failure detected after install. DDFS ""will not be started.
MEM-00002: Memory size(nnnnnnnnKB) goes below the configured size(nnnnnnnnKB)

*These may also be reported without the hyphen (-): e.g.
DIMM00001, DIMM00002, DIMM00003, ENVIRONMENT00009, ENVIRONMENT00013, ENVIRONMENT00044, MEM00001, MEM00002
  • Ponowne uruchomienie modułu alarmowego IPMI
  • Alert o mniejszej ilości pamięci niż oczekiwany
  • Możliwe zawieszenie się podczas autotestu po włączeniu (POST)
  • System nie uruchamia się lub ulega awarii

Cause

Moduły DIMM zainstalowane w systemach Datadomain mają kod "ECC" (Error Checking Code), który umożliwia naprawianie usuwalnych błędów pamięci w trakcie pracy. W przypadku przekroczenia progu błędów DDOS zgłasza usterkę i moduł DIMM, którego dotyczy problem, należy wymienić.
Niemożliwe do naprawienia błędy pamięci mogą spowodować ponowne uruchomienie systemu i są uważane za usterkę pamięci twardej.
Całkowita awaria pojedynczego modułu DIMM lub karty rozszerzeń pamięci (mieści wiele modułów DIMM) może spowodować awarię systemu i uniemożliwić włączenie systemu plików. Dzieje się tak, ponieważ proces DD Filesystem (DDFS) wypełnia większość pamięci fizycznej.

NUTA: Błędy pamięci mogą być maskowane przez inne objawy lub alerty — na przykład błąd sprawdzania procesora — może być wymagana głębsza analiza dziennika i rozwiązywanie problemów.

Resolution

Raportowanie błędów modułów DIMM jest śledzone we wszystkich wersjach DDOS. Jednak w celu zidentyfikowania konkretnego modułu DIMM, który uległ awarii, może być konieczna analiza dzienników systemowych.
Uwaga: Moduł DIMM może znajdować się w karcie nośnej pamięci podłączonej do płyty głównej.
         Aby system plików Data Domain (DDFS) mógł być włączony, CAŁA zainstalowana pamięć musi być obecna i funkcjonalna.

Rozwiązywanie problemów może obejmować:

  • Diagnostyka offline  
  • Analiza pliku dziennika
  • Ponowne umieszczanie podejrzanych modułów DIMM
  • Przenoszenie podejrzanych modułów DIMM do "znanych dobrych" gniazd (tj. czy błąd jest związany z modułem DIMM, gniazdem, kanałem lub kontrolerem?)
  • Wymiana uszkodzonego modułu DIMM lub risera (odpowiednio)  
  • Ciągłe monitorowanie w celu potwierdzenia stabilności systemu po zmianach lub wymianach sprzętu

Uwaga: Jeśli problem nie ustąpi po wykonaniu czynności opisanych w tym artykule bazy wiedzy, skontaktuj się z dostawcą pomocy technicznej lub utwórz zgłoszenie serwisowe .

Additional Information

Affected Products

Data Domain, PowerProtect Data Protection Appliance, Data Domain, Data Domain Deduplication Storage Systems, PowerProtect Data Protection Hardware
Article Properties
Article Number: 000034334
Article Type: Solution
Last Modified: 05 Aug 2025
Version:  7
Find answers to your questions from other Dell users
Support Services
Check if your device is covered by Support Services.