AMD Erratum 1474 Beschreibung

Zusammenfassung: Ein AMD CPU-Core reagiert möglicherweise nach etwa 1044 Tagen nicht mehr, gemäß AMD-Erratum 1474.

Dieser Artikel gilt für Dieser Artikel gilt nicht für Dieser Artikel ist nicht an ein bestimmtes Produkt gebunden. In diesem Artikel werden nicht alle Produktversionen aufgeführt.

Symptome

Dieses Problem betrifft die AMD EPYC™ 7002 Serie (Rome). Weitere Informationen finden Sie in der Tabelle der CPUs unten. 

Ein Core kann den Core-C6(CC6)-Ruhezustand etwa 1044 Tage nach dem letzten Neustart nicht beenden.

Die Ausfallzeit variiert je nach Verteilungsspektrum und REFCLK-Frequenz.

Die folgenden Symptome sind nicht erschöpfend, können aber helfen, das Problem zu identifizieren:
  • Unter Windows reagiert das System nicht mehr mit einem blauen Bildschirm, der "Bug Check 0x101" anzeigt.
  • Unter Linux gibt es keine offensichtlichen Symptome
  • Die Verfügbarkeit beträgt mehr als 1044 Tage. Diese Bedingung ist der Hauptindikator für das AMD Erratum 1474-Problem.
  
DPN Modellname
YVKJ6 7742
C59HD 7642
8JWMD 7542
5PG5C 7702
835 TD 7702P
3J0XY 7552
FG4GY 7502
3NFJT 7502P
542 T2 7402
YK5KC 7402P
Y96PT 7452
F9NJ5 7352
V99P3 7302
3425F 7302P
XPY7D 7262
J1 x 8 V 7282
XJG06 7252
DH26K 7232P
V0K1X 7272
GX27F 7662
CPHXD 7532
P5HDY 7F72
HVVJX 7F52
PDC7R 7F32
MTHGK 7H12

Ursache

Es handelt sich um öffentliche Informationen, die von AMD als folgenden Link (Seite 55) bereitgestellt werden. Der Zweck dieses PSQN besteht darin, TS und den Kunden daran zu erinnern, dass ein System nach 1044 Tagen Betriebszeit auf ein hängend ähnliches Problem stößt, das sich möglicherweise auf die Ursache dieses AMD-Erratums bezieht.

https://www.amd.com/system/files/TechDocs/56323-PUB_1.01.pdf

Lösung

Es gibt zwei Workarounds:
Option 1: Deaktivieren Sie cstate im BIOS, um zu verhindern, dass der CPU-Core in den cc6-Zustand übergeht.
Option 2: Starten Sie das System neu, bevor es eine Betriebszeit von 1.044 Tagen hat. Dies kann ein warmer oder kalter Neustart sein.

Wenn das System nicht mehr auf eine Betriebszeit von mehr als 1.044 Tagen reagiert, kann ein einziger Neustart das Problem umgehen.
Ein weiterer Neustart muss innerhalb der folgenden 1044 Tage erfolgen, wenn der Zähler erneut zurückgesetzt wird.

Betroffene Produkte

OEMR R6515, OEMR R6525, OEMR R7515, OEMR R7525, PowerEdge C6525, PowerEdge R6515, PowerEdge R6525, PowerEdge R7515, PowerEdge R7525

Produkte

PowerFlex appliance R6525, PowerFlex custom node R6525, Dell EMC vSAN R6515 Ready Node, Dell EMC vSAN R7515 Ready Node, PowerFlex appliance R7525
Artikeleigenschaften
Artikelnummer: 000215732
Artikeltyp: Solution
Zuletzt geändert: 10 Juni 2025
Version:  4
Antworten auf Ihre Fragen erhalten Sie von anderen Dell NutzerInnen
Support Services
Prüfen Sie, ob Ihr Gerät durch Support Services abgedeckt ist.