Ga naar hoofdinhoud
  • Snel en eenvoudig bestellen
  • Bestellingen en de verzendstatus bekijken
  • Een lijst met producten maken en openen
  • Beheer uw Dell EMC locaties, producten en contactpersonen op productniveau met Company Administration.

透過交換測試,故障診斷 PowerEdge 系統上的記憶體錯誤

Samenvatting: 交換記憶體 DIMM 以故障診斷 Dell Technologies PowerEdge 伺服器上的記憶體錯誤。

Dit artikel is mogelijk automatisch vertaald. Als u feedback hebt over de kwaliteit, laat het ons dan weten via het formulier onderaan deze pagina.

Article content


Symptomen

注意:本文不適用於搭載 Xeon 可擴充處理器的新系統。若為較新的系統,請查看此文章什麼是搭載 Intel Xeon 可擴充處理器的 Dell PowerEdge 伺服器上的 DDR4 自我修復功能?

透過交換測試,故障診斷 PowerEdge 系統上的記憶體錯誤

當一或多個記憶體 DIMM 位置回報單位元錯誤 (SBE) 和/或多位元錯誤 (MBE) 時,原因可能不是由 DIMM 本身造成,因此必須執行一些簡單的故障診斷,以判斷故障的確切位置。如需 R715 iDRAC 介面中出現的記憶體錯誤範例,請參閱 圖 1

iDRAC 6 記錄
圖 1:iDRAC 6 記錄中顯示的記憶體錯誤 (僅限英文版)

隔離記憶體問題是指將記憶體 DIMM 交換至不同的記憶體插槽、通道、記憶體庫和控制器。您可以透過多種方式交換 DIMM 以縮小故障範圍。您可能需要使用其中一種方法來找出故障的 DIMM 或插槽。您可以在下方找到這些方法的表示。為了讓說明更明確,我們假設故障的 DIMM 是 A1,或是影像中標示為藍色的其中一組。

注意:您可以在我們的記憶體文章中深入瞭解系統的記憶體。


最佳方法將 DIMM 依群組 (透過通道或銀行) 交換,而不是個別交換故障的 DIMM。
識別出包含故障的 DIMM 的 DIMM 群組後,可使用移動單一 DIMM 來識別故障的 DIMM。


方法 1:

將 DIMM A1 (藍色標示) 與 DIMM A9 (紅色標示) 交換,嘗試使用不同記憶體通道的 DIMM,以及記憶體庫

DIMM A1 至 A9
圖 2:將 DIMM A1 與 DIMM A9 交換
 

方法 2:

將 DIMM A1 (標示為藍色) 與 DIMM B1 (標示為紅色) 交換,會將 DIMM 置於完全不同的記憶體控制器 (CPU) 上。

DIMM A1 至 B1
圖 3:將 DIMM A1 與 DIMM B1 交換
 

方法 3:

將整個 DIMM 組 (A1、A2、A3 - 標記為藍色) 與另一個插槽 (B1、B2、B3 - 標記為紅色) 交換,會在新的記憶體控制器上測試新插槽中的整個 DIMM 組。

DIMMA 123 至 B123
圖 4:將 DIMM A1、A2、A3 與 DIMM B1、B2、B3 交換
 

方法 4

將整個通道的 DIMM (A1、A4、A7 - 標記為藍色) 與另一個通道 (B1、B2、B3 - 標記為紅色) 交換,在新通道和新的記憶體控制器上測試整個通道的 DIMM。

DIMM A147 至 B147
圖 5:將 DIMM A1、A4、A7 與 DIMM B1、B4、B7 交換
 

在交換 DIMM 後解譯結果

一般來說,DIMM 錯誤往往會遵循錯誤中所識別的 DIMM。例如在 DIMM A1 上使用 SBE 報告時,將此 DIMM 替換為不同的 DIMM,結果會出現下列狀況之一:

  1. 不再回報錯誤訊息,且問題已解決
  •   這表示重新安裝記憶體解決了此問題
  1. DIMM 出現錯誤訊息 (DIMM A1 已與 DIMM B1 交換,且 DIMM B1 現已回報錯誤訊息)
  • 這表示 DIMM 很可能故障,需要更換。
  1. DIMM 插槽出現錯誤訊息 (DIMM A1 已與 DIMM B1 交換,且 DIMM A1 仍回報錯誤訊息)
  • 這表示系統主機板或 CPU 很可能故障
  • 交換 CPU 可確認需要更換哪些元件
  • 如果 CPU 出現問題 (錯誤訊息會在交換 CPU 後移動),請更換 CPU
  • 如果 DIMM 插槽仍有問題,請更換主機板
  1. 如果 DIMM 或插槽未出現錯誤訊息 (交換後,系統會針對不同的 DIMM 回報錯誤)
  • 這表示不同的一個 DIMM 或多個 DIMM 很可能損壞
 
注意:我們建議您將韌體層級保持在最新狀態,如此可以降低收到記憶體錯誤的風險,並延長 DIMM 的使用壽命。
如需更多資訊,請參閱 Dell 知識文章 Dell Repository Manager (DRM)。

Oorzaak

不適用

Oplossing

不適用

Artikeleigenschappen


Getroffen product

PowerEdge

Datum laatst gepubliceerd

15 apr. 2024

Versie

8

Artikeltype

Solution