메인 콘텐츠로 이동
  • 빠르고 간편하게 주문
  • 주문 보기 및 배송 상태 추적
  • 제품 목록을 생성 및 액세스
  • 회사 관리를 사용하여 Dell EMC 사이트, 제품 및 제품 수준 연락처를 관리하십시오.

Fejlfinding af hukommelsesfejl på PowerEdge-systemer ved hjælp af swaptest

요약: Udskiftning af hukommelses-DIMM'er for at fejlfinde hukommelsesfejl på Dell Technologies PowerEdge-servere.

이 문서는 자동으로 번역되었을 수 있습니다. 번역 품질에 대한 의견이 있는 경우 페이지 하단의 양식을 사용해 알려 주시기 바랍니다.

문서 콘텐츠


증상

BEMÆRK: Denne artikel gælder ikke for nyere systemer med Xeon Scalable-processor. For nyere systemer, se denne artikel Hvad er DDR4 selvreparerende på Dell PowerEdge-servere med skalerbare Intel Xeon-processorer.

Fejlfinding af hukommelsesfejl på PowerEdge-systemer ved hjælp af swaptest

Når der rapporteres en enkeltbitfejl (SBE) og/eller multi-bit-fejl (MBE) på en eller flere hukommelses-DIMM-placeringer, skyldes årsagen muligvis ikke selve DIMM-modulet, så der skal udføres en simpel fejlfinding for at fastslå, hvor fejlen præcist ligger. Se figur 1 for et eksempel på hukommelsesfejl, der vises i iDRAC-grænsefladen på en R715.

iDRAC 6-logfiler
Figur 1: Hukommelsesfejl som vist i iDRAC 6-logfiler (Kun på engelsk)

Isolering af hukommelsesproblemer betyder, at hukommelses-DIMM er skal udskiftes i forskellige hukommelsessokler, -kanaler, -banker og -controllere. Du kan ombytte DIMM-moduler på flere måder for at indsnævre fejlen. Du skal muligvis bruge mere end én af disse metoder til at lokalisere det defekte DIMM-modul eller den defekte sokkel. Nedenfor finder du en repræsentation af disse metoder. For at gøre forklaringen enkel antager vi, at det defekte DIMM-modul er A1 eller et af de sæt, der er markeret med blåt på billederne.

Ombytning af DIMM-moduler i grupper (efter kanal eller bank) i stedet for individuelt er den bedste metode til at identificere det eller de fejlbehæftede DIMM-moduler.
Når det er blevet identificeret, at en gruppe DIMM-moduler indeholder det eller de fejlbehæftede DIMM-moduler, kan flytning af enkelte DIMM-moduler bruges til at identificere, hvilke DIMM-moduler der ikke fungerer.


Metode 1:

Sådan bytter du DIMM A1 (markeret med blåt) ud med DIMM A9 (markeret med rødt) for at prøve DIMM-modulet i en anden hukommelseskanal og banklinje


DIMM A1 til A9Figur 2: Udskiftning af DIMM A1 med DIMM A9
 

Metode 2:

Hvis DIMM A1 (markeret med blåt) byttes ud med DIMM B1 (markeret med rødt), kobles DIMM-modulet på en helt anden hukommelsescontroller (CPU).

DIMM A1 til B1
Figur 3: Skift DIMM A1 ud med DIMM B1
 

Metode 3:

Når du bytter hele banken af DIMM-moduler (A1, A2, A3 - markeret blå) med en anden bank (B1, B2, B3 - markeret med rødt), testes hele DIMM-samlingen i en ny bank på en ny hukommelsescontroller.

DIMMA 123 til B123
Figur 4: Bytte DIMM-moduler A1, A2, A3 med DIMM-moduler B1, B2, B3
 

Metode 4

Når du bytter en hel kanal med DIMM-moduler (A1, A4, A7 - markeret blåt) med en anden kanal (B1, B2, B3 - markeret rødt), testes hele DIMM-kanalen i en ny kanal og på en ny hukommelsescontroller.

DIMM A147 til B147
Figur 5: Bytte DIMM-moduler A1, A4, A7 med DIMM-moduler B1, B4, B7
 

Fortolkning af resultaterne efter ombytning af DIMM-moduler

Generelt har DIMM-fejl en tendens til at følge de DIMM-moduler, der er identificeret i fejlene. Med en SBE, der rapporterer på DIMM A1, resulterer ombytning af denne DIMM-modul med forskellige DIMM-moduler f.eks. i et af følgende:

  1. Fejlmeddelelsen rapporteres ikke længere, og problemet er løst
  •   Dette indikerer, at genindsættelse af hukommelsen løste problemet
  1. Fejlmeddelelsen følger DIMM (DIMM A1 byttes ud med DIMM B1, og fejlmeddelelser rapporteres nu mod DIMM B1)
  • Dette indikerer, at DIMM-modulet højst sandsynligt er defekt og skal udskiftes.
  1. Fejlmeddelelsen følger DIMM-soklen (DIMM A1 byttes ud med DIMM B1, og fejlmeddelelser rapporteres stadig mod DIMM A1)
  • Dette indikerer, at bundkortet eller CPU'en sandsynligvis er defekt
  • Udskiftning af CPU'er bekræfter, hvilken komponent der skal udskiftes
  • Hvis problemet følger efter CPU'en (fejlmeddelelsen flyttes efter ombytning af CPU'er), skal du udskifte CPU'en
  • Hvis problemet fortsat er med DIMM-stikket, skal du udskifte bundkortet
  1. Fejlmeddelelsen følger ikke DIMM-modulet eller soklen (fejlen rapporteres mod et andet DIMM-modul efter ombytning)
  • Dette indikerer, at et andet DIMM-modul eller DIMM-moduler sandsynligvis er dårligt
 
BEMÆRK: Vi anbefaler, at du også holder firmwareniveauerne opdaterede, da dette kan reducere risikoen for at modtage hukommelsesfejl og forlænge DIMM-modulernes levetid.
Du kan finde flere oplysninger i Dell Knowledge Base-artiklen Dell Repository Manager (DRM).

원인

Ikke relevant

해결

Ikke relevant

문서 속성


영향을 받는 제품

PowerEdge

마지막 게시 날짜

15 4월 2024

버전

8

문서 유형

Solution