AMD 勘误 1474 描述
摘要: 根据 AMD 勘误表 1474,AMD CPU 核心可能会在大约 1044 天后停止响应。
本文适用于
本文不适用于
本文并非针对某种特定的产品。
本文并非包含所有产品版本。
症状
此问题会影响 AMD EPYC™ 7002 系列 (Rome)。请参阅下面的 CPU 表以供参考。
在上次重新启动后大约 1044 天,核心无法退出 core-C6 (CC6) 睡眠状态。
故障时间因分布范围和 REFCLK 频率而异。
以下症状 并非详尽无遗,但可能有助于识别问题:
在上次重新启动后大约 1044 天,核心无法退出 core-C6 (CC6) 睡眠状态。
故障时间因分布范围和 REFCLK 频率而异。
以下症状 并非详尽无遗,但可能有助于识别问题:
- 在 Windows 上,系统停止响应并显示错误检查0x101
- 在 Linux 上,没有明显的症状
- 正常运行时间超过 1044 天。这种情况是 AMD 不稳定 1474 问题的主要指标。
| DPN | 型号名称 |
| YVKJ6 | 7742 |
| C59HD | 7642 |
| 8JWMD | 7542 |
| 5PG5C | 7702 |
| 835 TD | 7702P |
| 3J0XY | 7552 |
| FG4GY | 7502 |
| 3NFJT | 7502P |
| 542 T2 | 7402 |
| YK5KC | 7402P |
| Y96PT | 7452 |
| F9NJ5 | 7352 |
| V99P3 | 7302 |
| 3425F | 7302P |
| XPY7D | 7262 |
| J1X8V | 7282 |
| XJG06 | 7252 |
| DH26K | 7232P |
| V0K1X | 7272 |
| GX27F | 7662 |
| CPHXD | 7532 |
| P5HDY | 7F72 |
| HVVJX | 7F52 |
| PDC7R | 7F32 |
| MTHGK | 2012 年下半年 |
原因
这是 AMD 作为以下链接(第 55 页)提供的公开信息,此 PSQN 的目的是提醒 TS 和客户,当系统在 1044 天的正常运行时间后遇到类似挂起的问题时,可能与此 AMD 勘误描述的根本原因相关。
https://www.amd.com/system/files/TechDocs/56323-PUB_1.01.pdf
https://www.amd.com/system/files/TechDocs/56323-PUB_1.01.pdf
解决方案
有两种解决方法:
选项 1:在 BIOS 中禁用 cstate 以防止 CPU 核心进入 cc6 状态。
选项 2:在系统正常运行 1044 天之前重新启动系统。这可能是热重启或冷重启。
当系统停止响应正常运行时间超过 1044 天时,一次重新启动可以解决此问题。
在随后的 1044 天内,计数器将再次重置时,必须进行进一步重新启动。
选项 1:在 BIOS 中禁用 cstate 以防止 CPU 核心进入 cc6 状态。
选项 2:在系统正常运行 1044 天之前重新启动系统。这可能是热重启或冷重启。
当系统停止响应正常运行时间超过 1044 天时,一次重新启动可以解决此问题。
在随后的 1044 天内,计数器将再次重置时,必须进行进一步重新启动。
受影响的产品
OEMR R6515, OEMR R6525, OEMR R7515, OEMR R7525, PowerEdge C6525, PowerEdge R6515, PowerEdge R6525, PowerEdge R7515, PowerEdge R7525产品
PowerFlex appliance R6525, PowerFlex custom node R6525, Dell EMC vSAN R6515 Ready Node, Dell EMC vSAN R7515 Ready Node, PowerFlex appliance R7525文章属性
文章编号: 000215732
文章类型: Solution
上次修改时间: 10 6月 2025
版本: 4
从其他戴尔用户那里查找问题的答案
支持服务
检查您的设备是否在支持服务涵盖的范围内。