Passer au contenu principal
  • Passer des commandes rapidement et facilement
  • Afficher les commandes et suivre l’état de votre expédition
  • Profitez de récompenses et de remises réservées aux membres
  • Créez et accédez à une liste de vos produits
  • Gérer vos sites, vos produits et vos contacts au niveau des produits Dell EMC à l’aide de la rubrique Gestion des informations de l’entreprise.

Felsöka minnesfel på PowerEdge-system med växlingstestning

Résumé: Byta DIMM-minnesmoduler för att felsöka minnesfel på Dell Technologies PowerEdge-servrar.

Cet article a peut-être été traduit automatiquement. Si vous avez des commentaires concernant sa qualité, veuillez nous en informer en utilisant le formulaire au bas de cette page.

Contenu de l’article


Symptômes

Obs! Den här artikeln gäller inte nyare system med skalbara Xeon processorer. För nyare system kan du läsa artikeln Vad är självläkande DDR4 på Dell PowerEdge-servrar med Intel Xeon skalbara processorer.

Felsöka minnesfel på PowerEdge-system med växlingstestning

När ett enkelbitsfel (SBE) och/eller ett flerbitarsfel (MBE) rapporteras på en eller flera minnesDIMM-platser kanske orsaken inte beror på själva DIMM-kortet, så en enkel felsökning måste utföras för att fastställa exakt var felet ligger. Se bild 1 för ett exempel på minnesfel som visas i iDRAC-gränssnittet på en R715.

iDRAC 6-loggar
Figur 1: Minnesfel som visas i iDRAC 6-loggar (endast på engelska)

Isolering av minnesproblem innebär att man växlar DIMM-minnen till olika minnessocklar, kanaler, banker och styrenheter. Det finns flera sätt att byta plats på DIMM-modulerna för att begränsa felet. Du kan behöva använda mer än en av dessa metoder för att lokalisera den felaktiga DIMM-modulen eller sockeln. Nedan hittar du en representation av dessa metoder. För att göra förklaringen enkel antar vi att den felaktiga DIMM-modulen är A1 eller en av uppsättningarna som är markerade med blått på bilderna.

Den bästa metoden för att identifiera defekta DIMM-moduler är att byta DIMM-moduler i grupper (efter kanal eller bank) i stället för individuellt.
När en grupp DIMM-moduler har identifierats som inneslutande av den eller de DIMM-moduler som inte fungerar, kan rörliga enskilda DIMM-moduler användas för att identifiera vilka DIMM-moduler som inte fungerar.


Metod 1:

Byt ut DIMM A1 (markerad i blått) mot DIMM A9 (markerad i rött) för att prova DIMM i en annan minneskanal och bank


DIMM A1 till A9Bild 2: Byta ut DIMM A1 mot DIMM A9
 

Metod 2:

Om du byter ut DIMM A1 (markerad i blått) mot DIMM B1 (markerad i rött) placeras DIMM på en helt annan minnesstyrenhet (CPU).

DIMM A1 till B1
Figur 3: Byta ut DIMM A1 mot DIMM B1
 

Metod 3:

Om du byter ut hela banken med DIMM-moduler (A1, A2, A3 - markerad blå) mot en annan bank (B1, B2, B3 - markerad röd) testas hela banken med DIMM-moduler i en ny bank på en ny minnesstyrenhet.

DIMMA 123 till B123
Figur 4: Byta ut DIMM-modulerna A1, A2, A3 mot DIMM-modulerna B1, B2, B3
 

Metod 4

Byt ut en hel kanal med DIMM-moduler (A1, A4, A7 – markerad blå) mot en annan kanal (B1, B2, B3 – rödmarkerad) och testa hela kanalen med DIMM-moduler i en ny kanal och på en ny minnesstyrenhet.

DIMM A147 till B147
Figur 5: Byta ut DIMM-modulerna A1, A4, A7 mot DIMM-modulerna B1, B4, B7
 

Tolka resultaten efter byte av DIMM-moduler

I allmänhet tenderar DIMM-fel att följa de DIMM-moduler som identifieras i felen. Om du till exempel har en SBE som rapporterar om DIMM A1 och du byter ut den här DIMM mot en annan DIMM får du något av följande:

  1. Felmeddelandet rapporteras inte längre och problemet är löst
  •   Detta tyder på att återställandet av minnet löste problemet
  1. Felmeddelandet följer efter DIMM-modulen (DIMM A1 byts ut mot DIMM B1 och felmeddelanden rapporteras nu mot DIMM B1)
  • Detta indikerar att DIMM-modulen troligen är trasig och måste bytas ut.
  1. Felmeddelandet följer med DIMM-sockeln (DIMM A1 byts ut mot DIMM B1 och felmeddelanden rapporteras fortfarande mot DIMM A1)
  • Detta indikerar att moderkortet eller CPU:n med största sannolikhet är trasig
  • Om du byter processorer bekräftar du vilken komponent som behöver bytas ut
  • Om problemet följer efter CPU:n (felmeddelandet flyttas efter byte av CPU:er), byt ut CPU:n
  • Om problemet kvarstår med DIMM-sockeln byter du ut moderkortet
  1. Felmeddelandet följer inte med DIMM-modulen eller sockeln (felet rapporteras mot en annan DIMM-modul efter byte)
  • Detta indikerar att en annan DIMM- eller DIMM-modul troligen är dålig
 
Obs! Vi rekommenderar att du även håller nivåerna på den fasta mjukvaran uppdaterade eftersom detta kan minska risken för minnesfel och förlänga DIMM-modulernas livslängd.
Mer information finns i Dells kunskapsbasartikel Dell Repository Manager (DRM).

Cause

Gäller ej

Résolution

Gäller ej

Propriétés de l’article


Produit concerné

PowerEdge

Dernière date de publication

15 avr. 2024

Version

8

Type d’article

Solution