O PowerPath for AIX está fazendo com que um host pare de responder ou reinicialize após uma instalação do PowerPath 7.0 ou PowerPath 7.0 P01

Summary: O PowerPath for AIX está causando uma reinicialização inesperada do host todos os dias, por volta da meia-noite, após uma instalação (ou um upgrade para) o PowerPath 7.0 ou o PowerPath 7.0 P01. ...

This article applies to This article does not apply to This article is not tied to any specific product. Not all product versions are identified in this article.

Symptoms

Ambiente:
Software da Dell EMC: PowerPath 7.0 para AIX ou PowerPath 7.0 P01 para AIX
Software que não seja da Dell EMC: Instância do Oracle instalada no armazenamento legado da Dell EMC (armazenamento Dell gerenciado pelo array PowerPath-VMAX com microcódigo abaixo de 5978, Unity, VNX, VPLEX, PowerStore, XtremIO e assim por diante)Uma
linha como "0 0 * * * /etc/emc/bin/oracleinstance" é encontrada em crontab /var/spool/cron/crontabs/root.

Sintomas:
Executar /etc/emc/bin/oracleinstance manualmente está fazendo com que um host pare de responder ou reinicialize (não tente!)
O host para de responder e reinicializar inesperadamente todos os dias por volta da meia-noite. Uma análise do dump revela que o problema ocorre depois de invocar a função MpxSetDevOrainstMap .
O dump está exibindo o seguinte:

CRASH INFORMATION:
CPU 16 CSA F0xxxxxxxxxxxxxx at time of crash, error code for LEDs: 30000000
pvthread+194300 STACK:
[0000F434]___memmove64+000034 ()
[F1000000C049EE38]MpxSetDevOrainstMap+000138 (F1000C0310327E80, 0000000000000060)
[F1000000C04A90C8]MpxIocmd+0004C8 (0000015300000153, F1000C0310327E80,
   0000006000000060)
[F1000000C041517C]EmcpIocmd+0001FC (F00000002FF46B88, 0000015300000153,
   F1000C0310327E80, 0000006000000060)
[F1000000C042086C]power_ioctl+0003AC (8000000F00000000, 0000000400000004,
   000000002FF22998, 0000000000000003, 0000000000000000, 0000000000000000)
[00014D70].hkey_legacy_gate+00004C ()
[006A5D38]rdevioctl+0000B8 (??, ??, ??, ??, ??, ??)
[008E3F2C]spec_ioctl+00008C (??, ??, ??, ??, ??, ??)
[00704658]vnop_ioctl+000058 (??, ??, ??, ??, ??, ??)
[0071E774]vno_ioctl+0001B4 (??, ??, ??, ??, ??)
[007CF1F4]common_ioctl+000114 (??, ??, ??, ??)
[0000394C]syscall+000244 ()
[kdb_get_virtual_memory] no real storage @ 2FF228A8
[D011CA6C]D011CA6C ()
[kdb_read_mem] no real storage @ FFFFFFFFFFF60F0

Cause

Um script, /etc/emc/bin/oracleinstance, foi adicionado ao PowerPath for AIX 7.0 para lidar com o recurso "PowerPath Device in Use Reporting". Este script é executado todos os dias à meia-noite devido a uma entrada no crontab. O objetivo do script é criar uma lista de dispositivos usados pelo Oracle. Essa lista é então transmitida ao array para que uma prioridade mais alta possa ser dada a esses dispositivos. Esse recurso é compatível com arrays PowerMax com microcódigo 5978 e posterior.

Essa lista é criada mesmo quando não há nenhum array PowerMax conectado ao host. Isso faz com que um host pare de responder (devido a um problema) quando o array não é compatível com o recurso.

Resolution

Solução temporária:
Uma solução fácil consiste em remover ou comentar a entrada crontab para /etc/emc/bin/oracleinstance como root em /var/spool/cron/crontabs/root. Um comando crontab -e root pode ser executado. Ele invoca vi por padrão no arquivo crontab raiz e a entrada pode ser excluída. Consulte man crontab para obter mais detalhes.

Nota: A remoção dessa entrada não causa efeito adverso, especialmente se não houver armazenamento PowerMax (com microcódigo 5978 e posterior) compatível com a instância do Oracle. Se o script for removido enquanto o Oracle estiver usando dispositivos PowerMax, os dispositivos Oracle terão o mesmo desempenho que qualquer outro dispositivo no array.

Resolução:
O PowerPath for AIX 7.0 P02 e versões posteriores resolvem esse problema.

Additional Information

Veja o que é encontrado nas notas da versão do PowerPath 7.0 P02 for AIX:
 
Número do problema Resumo do problema Encontrado na versão Corrigido na versão
PPAI-783 Evite a falha do host e exiba uma mensagem de aviso caso a configuração exceda o máximo de caminhos compatíveis por dispositivo. 7.0 7,0 pág. 02
PPEE-711 Durante um LPM do AIX, vemos "E9595B51 0914221120 FALHA NO PONTO DE CONTROLE DO POWERPATH0" 7.0 7,0 pág. 02
PPAI-683 Falha do host do AIX causada pela funcionalidade do nome da instância do Oracle 7.0 7,0 pág. 02
PPAI-671 Todos os comandos pprootdev falham com "/usr/sbin/pprootdev[15]: (necessárioSpaceavaliableSpace)*
2: 0403-009 O número especificado não é válido para este comando."
7.0 7,0 pág. 02
PPEE-583 O console de gerenciamento do PowerPath perde comunicação com o equipamento todos os dias. 7.0 7,0 pág. 02
PPAI-618 PowerPath: powerdd: MpxPeriodicCallbackDaemon causou falha e reinicialização do AIX. 6.4 7.0
Article Properties
Article Number: 000172441
Article Type: Solution
Last Modified: 03 Jul 2024
Version:  4
Find answers to your questions from other Dell users
Support Services
Check if your device is covered by Support Services.