Descrição do AMD erratum 1474

Résumé: Um núcleo da CPU AMD pode parar de responder após cerca de 1044 dias, de acordo com o AMD erratum 1474.

Cet article concerne Cet article ne concerne pas Cet article n’est associé à aucun produit spécifique. Toutes les versions du produit ne sont pas identifiées dans cet article.

Symptômes

Esse problema afeta o AMD EPYC™ Série 7002 (Rome). Consulte a tabela de CPUs abaixo para referência. 

Um núcleo falha ao sair do estado de suspensão core-C6 (CC6) cerca de 1044 dias após a última reinicialização.

O tempo de falha varia de acordo com o espectro de propagação e a frequência DE REFCLK.

Os seguintes sintomas não são exaustivos, mas podem ajudar a identificar o problema:
  • No Windows, o sistema para de responder com tela azul que mostra a verificação de bugs 0x101
  • No Linux, não há sintomas óbvios
  • O tempo de funcionamento é superior a 1.044 dias. Essa condição é o principal indicador do problema amd erratum 1474.
  
DPN Nome do modelo
YVKJ6 7742
C59HD 7642
8JWMD 7542
5PG5C 7702
835 TD 7702P
3J0XY 7552
FG4GY 7502
3NFJT 7502P
542 T2 7402
AK5 KC 7402P
A96PT 7452
F9NJ5 7352
V99P3 7302
3425F 7302P
XPY7D 7262
J1X8 V 7282
XJG06 7252
DH26K 7232P
V0K1X 7272
GX27F 7662
CPHXD 7532
P5HDY 7F72
HVVJX 7F52
PDC7R 7F32
MTHGK 7H12

Cause

Trata-se de uma informação pública fornecida pela AMD como o link a seguir (página 55), e o objetivo deste PSQN é lembrar o TS e o cliente quando um sistema encontrar um problema de travamento após 1044 dias de tempo de funcionamento, pode estar relacionado à causa raiz deste erro da AMD descrito.

https://www.amd.com/system/files/TechDocs/56323-PUB_1.01.pdf

Résolution

Há duas soluções temporárias:
opção 1: Desative cstate no BIOS para evitar que o núcleo da CPU entre no estado cc6.
Opção 2: Reinicialize o sistema antes que ele tenha um tempo de funcionamento de 1044 dias. Isso pode ser uma reinicialização a quente ou a frio.

Quando o sistema para de responder ao tempo de funcionamento acima de 1.044 dias, uma única reinicialização pode contornar o problema.
Uma reinicialização adicional deve ocorrer dentro dos próximos 1044 dias, quando o contador será redefinido novamente.

Produits concernés

OEMR R6515, OEMR R6525, OEMR R7515, OEMR R7525, PowerEdge C6525, PowerEdge R6515, PowerEdge R6525, PowerEdge R7515, PowerEdge R7525

Produits

PowerFlex appliance R6525, PowerFlex custom node R6525, Dell EMC vSAN R6515 Ready Node, Dell EMC vSAN R7515 Ready Node, PowerFlex appliance R7525
Propriétés de l’article
Numéro d’article: 000215732
Type d’article: Solution
Dernière modification: 18 May 2026
Version:  5
Trouvez des réponses à vos questions auprès d’autres utilisateurs Dell
Services de support
Vérifiez si votre appareil est couvert par les services de support.