Solução:
Gere um relatório de logs do CMC.
Consulte
Obtenção de logs do Chassis Management Controller (CMC) M1000E.
O log do racdump exibe o seguinte:
# racadm getfanreqinfo
[Ambient Temperature Fan Request %]
38
[Server Module Fan Request Table]
<Núm. do slot#> |
<Nome do servidor> |
<Tipo de blade> |
<Estado de energia> |
<Presença> |
<% solicitação do ventilador> |
1 |
LVDEDESXIP1A |
N/D |
N/D |
Não presente |
N/D |
2 |
LVESXVDIIP1B |
N/D |
N/D |
Não presente |
N/D |
3 |
LVESXVDIIP1C |
N/D |
N/D |
Não presente |
N/D |
4 |
LVESXVDIIP1D |
N/D |
N/D |
Não presente |
N/D |
5 |
LVESXVDIIP1E |
PowerEdge M620 |
|
Presente |
38 |
6 |
LVESXVDIIP1F |
PowerEdge M620 |
|
Presente |
38 |
7 |
LVESXVDIIP1G |
PowerEdge M620 |
|
Presente |
38 |
8 |
LVESXVDIIP1H |
PowerEdge M620 |
|
Presente |
38 |
9 |
LVESXVDIIP1I |
PowerEdge M620 |
|
Presente |
38 |
10 |
LVESXVDIIP1J |
PowerEdge M620 |
|
Presente |
38 |
11 |
SLOT-11 |
N/D |
N/D |
Não presente |
N/D |
12 |
SLOT-12 |
N/D |
N/D |
Não presente |
N/D |
13 |
LVESXVDIIP1M |
PowerEdge M620 |
|
Presente |
38 |
14 |
LVESXVDIIP1N |
PowerEdge M620 |
|
Presente |
38 |
15 |
LVESXVDIIP1O |
PowerEdge M620 |
|
Presente |
38 |
16 |
LVESXVDIIP1AP |
PowerEdge M620 |
|
Presente |
38 |
[Switch Module Fan Request Table]
<E/S> |
<Nome> |
<Tipo> |
<Presença> |
<% solicitação do ventilador> |
Switch-1 |
MXL 10/40 GbE |
10 GbE KR |
Presente |
30 |
Switch-2 |
MXL 10/40 GbE |
10 GbE KR |
Presente |
83 |
Switch-3 |
MXL 10/40 GbE |
10 GbE KR |
Presente |
58 |
Switch-4 |
MXL 10/40 GbE |
10 GbE KR |
Presente |
30 |
Switch-5 |
Pass-through Ethernet da Dell |
Gigabit Ethernet |
Presente |
30 |
Switch-6 |
Pass-through Ethernet da Dell |
Gigabit Ethernet |
Presente |
30 |
Não substitua o hardware quando ocorrer esse problema. Esse sintoma sozinho não indica que há um problema.
O MXL/IOA começa a solicitar maior velocidade do ventilador quando ultrapassa a alta temperatura de aproximadamente 76 °C e não para de solicitar o aumento da velocidade do ventilador até que ele fique abaixo de 76 °C e, em seguida, não reduzirá a velocidade do ventilador até que a temperatura fique abaixo de 60 °C.
Integridade do IOM 1
Temperatura <= 60 °C - Temperatura operacional normal ou abaixo dela.
Reação do CMC: a velocidade do ventilador reduziu 4% a cada 20 segundos.
Integridade do IOM 2
Temperatura 61 ... 75 °C - Temperatura operacional normal.
Reação do CMC: nenhuma alteração na velocidade do ventilador.
Integridade do IOM 3
Temperatura 76 ... 83 ºC - Temperatura operacional elevada, mais refrigeração necessária.
Reação do CMC: a velocidade do ventilador aumentou 5% a cada 5 segundos.
Integridade do IOM 4
Temperatura 84 ... 85 °C - Temperatura crítica, refrigeração máxima necessária.
Reação do CMC: a velocidade do ventilador aumentou 20% a cada 5 segundos.
Integridade do IOM 5
Temperatura >= 86 °C - Sistema acima da temperatura, condição de oscilação térmica.
Reação do CMC: velocidade do ventilador a 100% PWM, e o IOM será desligado após 5 s.
Quando o MXL ou o IOA é inserido no chassi, recolocado ou quando o CMC é reinicializado, normalmente ele passa por um processo de aprendizado para encontrar a velocidade do ventilador que fornece estabilidade de temperatura para o IOM. Esse processo de aprendizado causa oscilações intencionais na velocidade do ventilador, e o chassi pode ir para 80% ou até mesmo 100% de PWM 1 ou 2 vezes antes da estabilização. O processo de aprendizado normalmente leva de 20 a 30 minutos para ser concluído, mas às vezes pode levar até 1 hora, devido à interferência das solicitações do blade do servidor.
Às vezes, o cliente tem dúvida se o MXL/IOA instalado em chassis diferentes será estável em diferentes velocidades do ventilador. A comparação da velocidade do ventilador de IOMs diferentes pode ser significativa apenas sob um conjunto rigoroso de condições.
Para fazer essa comparação, os IOMs precisam ser iguais em:
- Temperatura ambiente
- Slot instalado
- número e tipo de módulos externos instalados no MXL/IOA
- número de links internos e externos ativos
- número e tipo de ventiladores instalados
- número e tipo de IOMs vizinhos ativos
- número e tipo de blades de servidor ativos
- presença ou ausência de preenchimentos fictícios em slots vazios
- Tráfego
Todos esses fatores afetam a geração e a dissipação de calor no MXL/IOA, afetando a refrigeração necessária para obter a estabilidade de temperatura.