Feilsøke minnefeil på PowerEdge-systemer ved byttetesting
Resumen:Bytte minne-DIMM-er for å feilsøke minnefeil på Dell Technologies PowerEdge-servere.
Seleccione un producto para comprobar la relevancia del artículo
Este artículo se aplica a Este artículo no se aplica aEste artículo no está vinculado a ningún producto específico.No se identifican todas las versiones del producto en este artículo.
Feilsøke minnefeil på PowerEdge-systemer ved byttetesting
Når en enkeltbitsfeil (SBE) og/eller flerbitsfeil (MBE) rapporteres på én eller flere DIMM-minneplasseringer, er det ikke sikkert at årsaken skyldes selve DIMM-en, så det må utføres enkel feilsøking for å finne ut nøyaktig hvor feilen ligger. Se figur 1 for et eksempel på minnefeil som oppstår i iDRAC-grensesnittet på en R715.
Figur 1: Minnefeil som vist i iDRAC 6-logger (Bare på engelsk)
Isolering av minneproblemer betyr å bytte minne-DIMM-er til forskjellige minnekontakter, kanaler, banker og kontrollere. Det er flere måter du kan bytte DIMM-er rundt for å begrense feilen. Det kan hende du må bruke mer enn én av disse metodene for å finne feil DIMM eller sokkel. Nedenfor finner du en fremstilling av disse metodene. For å gjøre forklaringen enkel, antar vi at den defekte DIMM-en er A1 eller et av settene merket med blått på bildene.
Å bytte DIMM-er i grupper (etter kanal eller bank) i stedet for individuelt er den beste metoden for å identifisere de defekte DIMM- eller DIMM-ene. Når en gruppe DIMM-er er identifisert til å inneholde de defekte DIMM-ene eller DIMM-ene, kan du bruke bevegelige DIMM-er til å identifisere hvilke DIMM-er som ikke har oppstått.
Fremgangsmåte 1:
Bytt ut DIMM A1 (merket med blått) med DIMM A9 (rødt) for å prøve DIMM i en annen minnekanal og bank
Figur 2: Bytte DIMM A1 med DIMM A9
Fremgangsmåte 2:
Hvis du bytter ut DIMM A1 (merket med blått) med DIMM B1 (merket med rødt), settes DIMM-en på en helt annen minnekontroller (CPU).
Figur 3: Bytte DIMM A1 med DIMM B1
Fremgangsmåte 3:
Hvis du bytter ut hele banken med DIMM-er (A1, A2, A3 – merket blått) med en annen bank (B1, B2, B3 – merket rødt), testes hele banken med DIMM-er i en ny bank på en ny minnekontroller.
Figur 4: Bytte DIMM-ene A1, A2, A3 med DIMM-ene B1, B2 og B3
Fremgangsmåte 4
Hvis du bytter ut en hel kanal med DIMM-er (A1, A4, A7 – merket med blått) med en annen kanal (B1, B2, B3 – merket med rødt), tester du hele kanalen med DIMM-er i en ny kanal og på en ny minnekontroller.
Figur 5: Bytte DIMM-ene A1, A4, A7 med DIMM-ene B1, B4 og B7
Tolke resultatene etter bytte av DIMM-er
Vanligvis har DIMM-feil en tendens til å følge DIMM-ene som er identifisert i feilene. For eksempel med en SBE-rapportering om DIMM A1, vil bytte denne DIMM-en med en annen DIMM fører til ett av følgende:
Feilmeldingen rapporteres ikke lenger, og problemet er løst
Dette indikerer at det løste problemet å ta ut minnet på nytt
Feilmeldingen følger DIMM (DIMM A1 byttes ut med DIMM B1, og feilmeldinger rapporteres nå mot DIMM B1)
Dette indikerer at DIMM-en mest sannsynlig mislyktes og må byttes ut.
Feilmeldingen følger DIMM-kontakten (DIMM A1 byttes ut med DIMM B1, og feilmeldinger rapporteres fortsatt mot DIMM A1)
Dette indikerer at hovedkortet eller CPUen mest sannsynlig er feil
Bytte av CPU-er bekrefter hvilken komponent som må byttes ut
Hvis problemet følger CPU-en (feilmeldingen flyttes etter bytte av CPU-er), bytter du ut CPU-en
Bytt ut hovedkortet hvis problemet vedvarer i DIMM-kontakten
Feilmeldingen følger ikke DIMM eller sokkelen (feilen rapporteres mot en annen DIMM etter bytte)
Dette indikerer at en annen DIMM eller DIMM mest sannsynlig er dårlig
MERK: Vi anbefaler deg også å holde fastvarenivåene oppdatert, da dette kan redusere risikoen for å motta minnefeil og forlenge levetiden til DIMM-ene.
Hvis du vil ha mer informasjon, kan du se følgende artikkel i Dells kunnskapsbase Dell Repository Manager (DRM).