O PowerPath for AIX está fazendo com que um host pare de responder ou reinicialize após uma instalação do PowerPath 7.0 ou PowerPath 7.0 P01
Summary: O PowerPath for AIX está causando uma reinicialização inesperada do host todos os dias, por volta da meia-noite, após uma instalação (ou um upgrade para) o PowerPath 7.0 ou o PowerPath 7.0 P01. ...
Symptoms
Ambiente:
Software da Dell EMC: PowerPath 7.0 para AIX ou PowerPath 7.0 P01 para AIX
Software que não seja da Dell EMC: Instância do Oracle instalada no armazenamento legado da Dell EMC (armazenamento Dell gerenciado pelo array PowerPath-VMAX com microcódigo abaixo de 5978, Unity, VNX, VPLEX, PowerStore, XtremIO e assim por diante)Uma
linha como "0 0 * * * /etc/emc/bin/oracleinstance" é encontrada em crontab /var/spool/cron/crontabs/root.
Sintomas:
Executar /etc/emc/bin/oracleinstance manualmente está fazendo com que um host pare de responder ou reinicialize (não tente!)
O host para de responder e reinicializar inesperadamente todos os dias por volta da meia-noite. Uma análise do dump revela que o problema ocorre depois de invocar a função MpxSetDevOrainstMap .
O dump está exibindo o seguinte:
CRASH INFORMATION:
CPU 16 CSA F0xxxxxxxxxxxxxx at time of crash, error code for LEDs: 30000000
pvthread+194300 STACK:
[0000F434]___memmove64+000034 ()
[F1000000C049EE38]MpxSetDevOrainstMap+000138 (F1000C0310327E80, 0000000000000060)
[F1000000C04A90C8]MpxIocmd+0004C8 (0000015300000153, F1000C0310327E80,
0000006000000060)
[F1000000C041517C]EmcpIocmd+0001FC (F00000002FF46B88, 0000015300000153,
F1000C0310327E80, 0000006000000060)
[F1000000C042086C]power_ioctl+0003AC (8000000F00000000, 0000000400000004,
000000002FF22998, 0000000000000003, 0000000000000000, 0000000000000000)
[00014D70].hkey_legacy_gate+00004C ()
[006A5D38]rdevioctl+0000B8 (??, ??, ??, ??, ??, ??)
[008E3F2C]spec_ioctl+00008C (??, ??, ??, ??, ??, ??)
[00704658]vnop_ioctl+000058 (??, ??, ??, ??, ??, ??)
[0071E774]vno_ioctl+0001B4 (??, ??, ??, ??, ??)
[007CF1F4]common_ioctl+000114 (??, ??, ??, ??)
[0000394C]syscall+000244 ()
[kdb_get_virtual_memory] no real storage @ 2FF228A8
[D011CA6C]D011CA6C ()
[kdb_read_mem] no real storage @ FFFFFFFFFFF60F0
Cause
Essa lista é criada mesmo quando não há nenhum array PowerMax conectado ao host. Isso faz com que um host pare de responder (devido a um problema) quando o array não é compatível com o recurso.
Resolution
Uma solução fácil consiste em remover ou comentar a entrada crontab para /etc/emc/bin/oracleinstance como root em /var/spool/cron/crontabs/root. Um comando crontab -e root pode ser executado. Ele invoca vi por padrão no arquivo crontab raiz e a entrada pode ser excluída. Consulte man crontab para obter mais detalhes.
Nota: A remoção dessa entrada não causa efeito adverso, especialmente se não houver armazenamento PowerMax (com microcódigo 5978 e posterior) compatível com a instância do Oracle. Se o script for removido enquanto o Oracle estiver usando dispositivos PowerMax, os dispositivos Oracle terão o mesmo desempenho que qualquer outro dispositivo no array.
Resolução:
O PowerPath for AIX 7.0 P02 e versões posteriores resolvem esse problema.
Additional Information
| Número do problema | Resumo do problema | Encontrado na versão | Corrigido na versão |
|---|---|---|---|
| PPAI-783 | Evite a falha do host e exiba uma mensagem de aviso caso a configuração exceda o máximo de caminhos compatíveis por dispositivo. | 7.0 | 7,0 pág. 02 |
| PPEE-711 | Durante um LPM do AIX, vemos "E9595B51 0914221120 FALHA NO PONTO DE CONTROLE DO POWERPATH0" | 7.0 | 7,0 pág. 02 |
| PPAI-683 | Falha do host do AIX causada pela funcionalidade do nome da instância do Oracle | 7.0 | 7,0 pág. 02 |
| PPAI-671 | Todos os comandos pprootdev falham com "/usr/sbin/pprootdev[15]: (necessárioSpaceavaliableSpace)* 2: 0403-009 O número especificado não é válido para este comando." |
7.0 | 7,0 pág. 02 |
| PPEE-583 | O console de gerenciamento do PowerPath perde comunicação com o equipamento todos os dias. | 7.0 | 7,0 pág. 02 |
| PPAI-618 | PowerPath: powerdd: MpxPeriodicCallbackDaemon causou falha e reinicialização do AIX. | 6.4 | 7.0 |