解决方案:
生成 CMC 日志报告。
请参阅
从 M1000E Chassis Management Controller (CMC) 获取日志。
您会在 racdump 日志中看到以下内容:
# racadm getfanreqinfo
[环境温度风扇请求 %]
38
[服务器模块风扇请求表]
<插槽编号> |
<服务器名称> |
<刀片类型> |
<电源状态> |
<是否存在> |
<风扇请求 %> |
1 |
LVDEDESXIP1A |
不适用 |
不适用 |
不存在 |
不适用 |
2 |
LVESXVDIIP1B |
不适用 |
不适用 |
不存在 |
不适用 |
3 |
LVESXVDIIP1C |
不适用 |
不适用 |
不存在 |
不适用 |
4 |
LVESXVDIIP1D |
不适用 |
不适用 |
不存在 |
不适用 |
5 |
LVESXVDIIP1E |
PowerEdge M620 |
|
存在 |
38 |
6 |
LVESXVDIIP1F |
PowerEdge M620 |
|
存在 |
38 |
7 |
LVESXVDIIP1G |
PowerEdge M620 |
|
存在 |
38 |
8 |
LVESXVDIIP1H |
PowerEdge M620 |
|
存在 |
38 |
9 |
LVESXVDIIP1I |
PowerEdge M620 |
|
存在 |
38 |
10 |
LVESXVDIIP1J |
PowerEdge M620 |
|
存在 |
38 |
11 |
SLOT-11 |
不适用 |
不适用 |
不存在 |
不适用 |
12 |
SLOT-12 |
不适用 |
不适用 |
不存在 |
不适用 |
13 |
LVESXVDIIP1M |
PowerEdge M620 |
|
存在 |
38 |
14 |
LVESXVDIIP1N |
PowerEdge M620 |
|
存在 |
38 |
15 |
LVESXVDIIP1O |
PowerEdge M620 |
|
存在 |
38 |
16 |
LVESXVDIIP1AP |
PowerEdge M620 |
|
存在 |
38 |
[交换机模块风扇请求表]
<IO> |
<名称> |
<类型> |
<是否存在> |
<风扇请求 %> |
Switch-1 |
MXL 10/40GbE |
10 GbE KR |
存在 |
30 |
Switch-2 |
MXL 10/40GbE |
10 GbE KR |
存在 |
83 |
Switch-3 |
MXL 10/40GbE |
10 GbE KR |
存在 |
58 |
Switch-4 |
MXL 10/40GbE |
10 GbE KR |
存在 |
30 |
Switch-5 |
Dell Ethernet Pass-Through |
千兆以太网 |
存在 |
30 |
Switch-6 |
Dell Ethernet Pass-Through |
千兆以太网 |
存在 |
30 |
请勿因此问题更换硬件。仅凭这一点无法断定存在问题。
MXL/IOA 在温度超过约 76C 时开始请求更高的风扇速度,在温度降至 76C 以下之前不会停止请求更高的风扇速度,并且在温度降至 60C 以下之前不会开始降低风扇速度。
IOM 运行状况 1
温度<= 60C — 处于或低于正常运行温度。
CMC 反应:风扇速度每 20 秒降低 4%。
IOM 运行状况 2
温度 61 … 75C — 正常运行温度。
CMC 反应:风扇速度无变化。
IOM 运行状况 3
温度 76 … 83C — 运行温度较高,需要更多冷却。
CMC 反应:风扇速度每 5 秒提高 5%。
IOM 运行状况 4
温度 84 … 85C — 温度非常高,需要最大冷却。
CMC 反应:风扇速度每 5 秒提高 20%。
IOM 运行状况 5
温度 >= 86C — 系统超温,热敏断路情况。
CMC 反应:风扇速度为 100% PWM,IOM 将在 5 秒后关闭。
将 MXL 或 IOA 插入机箱、重新拔插或 CMC 重新启动时,通常会经历一个学习过程来找到为 IOM 提供温度稳定性的风扇速度。此学习过程会导致预期的风扇速度震荡,并且在稳定之前,机箱可能会有一次或两次达到 80% 甚至 100% PWM。学习过程通常需要 20-30 分钟才能完成,但有时由于服务器刀片请求的干扰,可能需要长达 1 小时。
有时,客户担心安装在不同机箱中的 MXL/IOA 在不同风扇速度下达到稳定。只有在一组严格的条件下,不同 IOM 的风扇速度比较才有意义。
要进行这样的比较,IOM 需要具有相同的:
- 室温
- 安装插槽
- MXL/IOA 中安装的外部模块的数量和类型
- 活动内部和外部链路的数量
- 安装的风扇数量和类型
- 活动相邻 IOM 的数量和类型
- 活动服务器刀片的数量和类型
- 空插槽中是否存在虚设物
- 流量
所有这些因素都会影响 MXL/IOA 中的热量生成和散热,从而影响实现温度稳定性所需的冷却。