Skip to main content
  • Place orders quickly and easily
  • View orders and track your shipping status
  • Create and access a list of your products
  • Manage your Dell EMC sites, products, and product-level contacts using Company Administration.

Felsöka minnesfel på PowerEdge-system med växlingstestning

Summary: Byta DIMM-minnesmoduler för att felsöka minnesfel på Dell Technologies PowerEdge-servrar.

This article may have been automatically translated. If you have any feedback regarding its quality, please let us know using the form at the bottom of this page.

Article Content


Symptoms

Obs! Den här artikeln gäller inte nyare system med skalbara Xeon processorer. För nyare system kan du läsa artikeln Vad är självläkande DDR4 på Dell PowerEdge-servrar med Intel Xeon skalbara processorer.

Felsöka minnesfel på PowerEdge-system med växlingstestning

När ett enkelbitsfel (SBE) och/eller ett flerbitarsfel (MBE) rapporteras på en eller flera minnesDIMM-platser kanske orsaken inte beror på själva DIMM-kortet, så en enkel felsökning måste utföras för att fastställa exakt var felet ligger. Se bild 1 för ett exempel på minnesfel som visas i iDRAC-gränssnittet på en R715.

iDRAC 6-loggar
Figur 1: Minnesfel som visas i iDRAC 6-loggar (endast på engelska)

Isolering av minnesproblem innebär att man växlar DIMM-minnen till olika minnessocklar, kanaler, banker och styrenheter. Det finns flera sätt att byta plats på DIMM-modulerna för att begränsa felet. Du kan behöva använda mer än en av dessa metoder för att lokalisera den felaktiga DIMM-modulen eller sockeln. Nedan hittar du en representation av dessa metoder. För att göra förklaringen enkel antar vi att den felaktiga DIMM-modulen är A1 eller en av uppsättningarna som är markerade med blått på bilderna.

Obs! Du kan läsa mer om minne för dina system i våra minnesartiklar.


Den bästa metoden för att identifiera defekta DIMM-moduler är att byta DIMM-moduler i grupper (efter kanal eller bank) i stället för individuellt.
När en grupp DIMM-moduler har identifierats som inneslutande av den eller de DIMM-moduler som inte fungerar, kan rörliga enskilda DIMM-moduler användas för att identifiera vilka DIMM-moduler som inte fungerar.


Metod 1:

Byt ut DIMM A1 (markerad i blått) mot DIMM A9 (markerad i rött) för att prova DIMM i en annan minneskanal och bank


DIMM A1 till A9Bild 2: Byta ut DIMM A1 mot DIMM A9
 

Metod 2:

Om du byter ut DIMM A1 (markerad i blått) mot DIMM B1 (markerad i rött) placeras DIMM på en helt annan minnesstyrenhet (CPU).

DIMM A1 till B1
Figur 3: Byta ut DIMM A1 mot DIMM B1
 

Metod 3:

Om du byter ut hela banken med DIMM-moduler (A1, A2, A3 - markerad blå) mot en annan bank (B1, B2, B3 - markerad röd) testas hela banken med DIMM-moduler i en ny bank på en ny minnesstyrenhet.

DIMMA 123 till B123
Figur 4: Byta ut DIMM-modulerna A1, A2, A3 mot DIMM-modulerna B1, B2, B3
 

Metod 4

Byt ut en hel kanal med DIMM-moduler (A1, A4, A7 – markerad blå) mot en annan kanal (B1, B2, B3 – rödmarkerad) och testa hela kanalen med DIMM-moduler i en ny kanal och på en ny minnesstyrenhet.

DIMM A147 till B147
Figur 5: Byta ut DIMM-modulerna A1, A4, A7 mot DIMM-modulerna B1, B4, B7
 

Tolka resultaten efter byte av DIMM-moduler

I allmänhet tenderar DIMM-fel att följa de DIMM-moduler som identifieras i felen. Om du till exempel har en SBE som rapporterar om DIMM A1 och du byter ut den här DIMM mot en annan DIMM får du något av följande:

  1. Felmeddelandet rapporteras inte längre och problemet är löst
  •   Detta tyder på att återställandet av minnet löste problemet
  1. Felmeddelandet följer efter DIMM-modulen (DIMM A1 byts ut mot DIMM B1 och felmeddelanden rapporteras nu mot DIMM B1)
  • Detta indikerar att DIMM-modulen troligen är trasig och måste bytas ut.
  1. Felmeddelandet följer med DIMM-sockeln (DIMM A1 byts ut mot DIMM B1 och felmeddelanden rapporteras fortfarande mot DIMM A1)
  • Detta indikerar att moderkortet eller CPU:n med största sannolikhet är trasig
  • Om du byter processorer bekräftar du vilken komponent som behöver bytas ut
  • Om problemet följer efter CPU:n (felmeddelandet flyttas efter byte av CPU:er), byt ut CPU:n
  • Om problemet kvarstår med DIMM-sockeln byter du ut moderkortet
  1. Felmeddelandet följer inte med DIMM-modulen eller sockeln (felet rapporteras mot en annan DIMM-modul efter byte)
  • Detta indikerar att en annan DIMM- eller DIMM-modul troligen är dålig
 
Obs! Vi rekommenderar att du även håller nivåerna på den fasta mjukvaran uppdaterade eftersom detta kan minska risken för minnesfel och förlänga DIMM-modulernas livslängd.
Mer information finns i Dells kunskapsbasartikel Dell Repository Manager (DRM).

Cause

Gäller ej

Resolution

Gäller ej

Article Properties


Affected Product

PowerEdge

Last Published Date

15 Apr 2024

Version

8

Article Type

Solution