Skip to main content
  • Place orders quickly and easily
  • View orders and track your shipping status
  • Create and access a list of your products
  • Manage your Dell EMC sites, products, and product-level contacts using Company Administration.

Feilsøke minnefeil på PowerEdge-systemer ved byttetesting

Summary: Bytte minne-DIMM-er for å feilsøke minnefeil på Dell Technologies PowerEdge-servere.

This article may have been automatically translated. If you have any feedback regarding its quality, please let us know using the form at the bottom of this page.

Article Content


Symptoms

MERK: Denne artikkelen gjelder ikke for nyere systemer med Xeon Scalable Processor. For nyere systemer kan du sjekke denne artikkelen Hva er DDR4-selvreparasjon på Dell PowerEdge-servere med Intel Xeon Scalable-prosessorer?

Feilsøke minnefeil på PowerEdge-systemer ved byttetesting

Når en enkeltbitsfeil (SBE) og/eller flerbitsfeil (MBE) rapporteres på én eller flere DIMM-minneplasseringer, er det ikke sikkert at årsaken skyldes selve DIMM-en, så det må utføres enkel feilsøking for å finne ut nøyaktig hvor feilen ligger. Se figur 1 for et eksempel på minnefeil som oppstår i iDRAC-grensesnittet på en R715.

iDRAC 6-logger
Figur 1: Minnefeil som vist i iDRAC 6-logger (Bare på engelsk)

Isolering av minneproblemer betyr å bytte minne-DIMM-er til forskjellige minnekontakter, kanaler, banker og kontrollere. Det er flere måter du kan bytte DIMM-er rundt for å begrense feilen. Det kan hende du må bruke mer enn én av disse metodene for å finne feil DIMM eller sokkel. Nedenfor finner du en fremstilling av disse metodene. For å gjøre forklaringen enkel, antar vi at den defekte DIMM-en er A1 eller et av settene merket med blått på bildene.

MERK: Du kan lese mer om minne for systemene dine i minneartiklene våre.


Å bytte DIMM-er i grupper (etter kanal eller bank) i stedet for individuelt er den beste metoden for å identifisere de defekte DIMM- eller DIMM-ene.
Når en gruppe DIMM-er er identifisert til å inneholde de defekte DIMM-ene eller DIMM-ene, kan du bruke bevegelige DIMM-er til å identifisere hvilke DIMM-er som ikke har oppstått.


Fremgangsmåte 1:

Bytt ut DIMM A1 (merket med blått) med DIMM A9 (rødt) for å prøve DIMM i en annen minnekanal og bank


DIMM A1 til A9Figur 2: Bytte DIMM A1 med DIMM A9
 

Fremgangsmåte 2:

Hvis du bytter ut DIMM A1 (merket med blått) med DIMM B1 (merket med rødt), settes DIMM-en på en helt annen minnekontroller (CPU).

DIMM A1 til B1
Figur 3: Bytte DIMM A1 med DIMM B1
 

Fremgangsmåte 3:

Hvis du bytter ut hele banken med DIMM-er (A1, A2, A3 – merket blått) med en annen bank (B1, B2, B3 – merket rødt), testes hele banken med DIMM-er i en ny bank på en ny minnekontroller.

DIMMA 123 til B123
Figur 4: Bytte DIMM-ene A1, A2, A3 med DIMM-ene B1, B2 og B3
 

Fremgangsmåte 4

Hvis du bytter ut en hel kanal med DIMM-er (A1, A4, A7 – merket med blått) med en annen kanal (B1, B2, B3 – merket med rødt), tester du hele kanalen med DIMM-er i en ny kanal og på en ny minnekontroller.

DIMM A147 til B147
Figur 5: Bytte DIMM-ene A1, A4, A7 med DIMM-ene B1, B4 og B7
 

Tolke resultatene etter bytte av DIMM-er

Vanligvis har DIMM-feil en tendens til å følge DIMM-ene som er identifisert i feilene. For eksempel med en SBE-rapportering om DIMM A1, vil bytte denne DIMM-en med en annen DIMM fører til ett av følgende:

  1. Feilmeldingen rapporteres ikke lenger, og problemet er løst
  •   Dette indikerer at det løste problemet å ta ut minnet på nytt
  1. Feilmeldingen følger DIMM (DIMM A1 byttes ut med DIMM B1, og feilmeldinger rapporteres nå mot DIMM B1)
  • Dette indikerer at DIMM-en mest sannsynlig mislyktes og må byttes ut.
  1. Feilmeldingen følger DIMM-kontakten (DIMM A1 byttes ut med DIMM B1, og feilmeldinger rapporteres fortsatt mot DIMM A1)
  • Dette indikerer at hovedkortet eller CPUen mest sannsynlig er feil
  • Bytte av CPU-er bekrefter hvilken komponent som må byttes ut
  • Hvis problemet følger CPU-en (feilmeldingen flyttes etter bytte av CPU-er), bytter du ut CPU-en
  • Bytt ut hovedkortet hvis problemet vedvarer i DIMM-kontakten
  1. Feilmeldingen følger ikke DIMM eller sokkelen (feilen rapporteres mot en annen DIMM etter bytte)
  • Dette indikerer at en annen DIMM eller DIMM mest sannsynlig er dårlig
 
MERK: Vi anbefaler deg også å holde fastvarenivåene oppdatert, da dette kan redusere risikoen for å motta minnefeil og forlenge levetiden til DIMM-ene.
Hvis du vil ha mer informasjon, kan du se følgende artikkel i Dells kunnskapsbase Dell Repository Manager (DRM).

Cause

Ikke aktuelt

Resolution

Ikke aktuelt

Article Properties


Affected Product

PowerEdge

Last Published Date

15 Apr 2024

Version

8

Article Type

Solution