PowerPath for AIX provoque le blocage ou le redémarrage d’un hôte après une installation de PowerPath 7.0 ou PowerPath 7.0 P01

Summary: PowerPath for AIX provoque un redémarrage inattendu de l’hôte tous les jours vers minuit après une installation (ou une mise à niveau de) PowerPath 7.0 ou PowerPath 7.0 P01.

This article applies to This article does not apply to This article is not tied to any specific product. Not all product versions are identified in this article.

Symptoms

Environnement:
Logiciels Dell EMC : PowerPath 7.0 for AIX ou PowerPath 7.0 P01 for AIX
Logiciels non-Dell EMC : Instance Oracle installée sur le stockage Dell EMC existant (stockage Dell géré par la baie PowerPath-VMAX avec un microcode inférieur à 5978, Unity, VNX, VPLEX, PowerStore, XtremIO, etc.)
Une ligne telle que « 0 0 * * * /etc/emc/bin/oracleinstance » se trouve dans crontab /var/spool/cron/crontabs/root.

Symptômes:
L’exécution manuelle de /etc/emc/bin/oracleinstance provoque l’arrêt ou le redémarrage d’un hôte (n’essayez pas !)
L’hôte cesse de répondre et redémarre de manière inattendue tous les jours vers minuit. Une analyse du vidage révèle que le problème se produit après l’appel de la fonction MpxSetDevOrainstMap .
Le vidage affiche les éléments suivants :

CRASH INFORMATION:
CPU 16 CSA F0xxxxxxxxxxxxxx at time of crash, error code for LEDs: 30000000
pvthread+194300 STACK:
[0000F434]___memmove64+000034 ()
[F1000000C049EE38]MpxSetDevOrainstMap+000138 (F1000C0310327E80, 0000000000000060)
[F1000000C04A90C8]MpxIocmd+0004C8 (0000015300000153, F1000C0310327E80,
   0000006000000060)
[F1000000C041517C]EmcpIocmd+0001FC (F00000002FF46B88, 0000015300000153,
   F1000C0310327E80, 0000006000000060)
[F1000000C042086C]power_ioctl+0003AC (8000000F00000000, 0000000400000004,
   000000002FF22998, 0000000000000003, 0000000000000000, 0000000000000000)
[00014D70].hkey_legacy_gate+00004C ()
[006A5D38]rdevioctl+0000B8 (??, ??, ??, ??, ??, ??)
[008E3F2C]spec_ioctl+00008C (??, ??, ??, ??, ??, ??)
[00704658]vnop_ioctl+000058 (??, ??, ??, ??, ??, ??)
[0071E774]vno_ioctl+0001B4 (??, ??, ??, ??, ??)
[007CF1F4]common_ioctl+000114 (??, ??, ??, ??)
[0000394C]syscall+000244 ()
[kdb_get_virtual_memory] no real storage @ 2FF228A8
[D011CA6C]D011CA6C ()
[kdb_read_mem] no real storage @ FFFFFFFFFFF60F0

Cause

Un script, /etc/emc/bin/oracleinstance, a été ajouté à PowerPath for AIX 7.0 pour gérer la fonctionnalité de création de rapports sur l’appareil PowerPath en cours d’utilisation. Ce script est exécuté tous les jours à minuit en raison d’une entrée dans crontab. Le but du script est de créer une liste des périphériques utilisés par Oracle. Cette liste est ensuite transmise à la baie afin qu’une priorité plus élevée puisse être accordée à ces appareils. Cette fonctionnalité est prise en charge par les baies PowerMax avec le microcode 5978 et versions ultérieures.

Cette liste est créée même lorsqu’aucune baie PowerMax n’est rattachée à l’hôte. Cela entraîne l’arrêt de l’hôte (en raison d’un problème) lorsque la baie ne prend pas en charge la fonctionnalité.

Resolution

Solution de contournement :
Une solution de contournement simple consiste à supprimer ou à commenter l’entrée crontab pour /etc/emc/bin/oracleinstance en tant qu’utilisateur root dans /var/spool/cron/crontabs/root. Il est possible d’exécuter la commande root crontab -e . Il appelle vi par défaut sur le fichier crontab racine et l’entrée peut alors être supprimée. Pour plus d’informations, reportez-vous à man crontab .

Note: La suppression de cette entrée n’a aucun effet négatif, en particulier s’il n’y a pas de stockage PowerMax (avec le microcode 5978 et versions ultérieures) prenant en charge l’instance Oracle. Si le script est supprimé alors qu’Oracle utilise des périphériques PowerMax, les périphériques Oracle ont les mêmes performances que n’importe quel autre périphérique de la baie.

Résolution:
PowerPath for AIX 7.0 P02 et versions supérieures résolvent ce problème.

Additional Information

Voici ce que l’on trouve dans les notes de mise à jour de PowerPath 7.0 P02 for AIX :
 
Numéro du problème Récapitulatif du problème Trouvé dans la version Corrigé dans la version
PPAI-783 Permet d’éviter le blocage de l’hôte et d’afficher un message d’avertissement si la configuration dépasse le nombre maximal de chemins pris en charge par périphérique. 7.0 7.0 P02
Réf. PPEE-711 Au cours d’une LPM AIX, le message « E9595B51 0914221120 I S powerpath0 CONTROL POINT FAILURE » S’AFFICHE 7.0 7.0 P02
PPAI-683 Blocage de l’hôte AIX causé par la fonctionnalité de nom d’instance Oracle 7.0 7.0 P02
PPAI-671 Toutes les commandes pprootdev échouent avec « /usr/sbin/pprootdev[15] : (requiredSpaceavailableSpace)*
2 : 0403-009 Le nombre spécifié n’est pas valide pour cette commande. »
7.0 7.0 P02
Réf. PPEE-583 La console de gestion PowerPath perd la communication avec l’appliance chaque jour. 7.0 7.0 P02
PPAI-618 PowerPath : powerdd : MpxPeriodicCallbackDaemon a provoqué l’échec et le redémarrage d’AIX. 6,4 7.0
Article Properties
Article Number: 000172441
Article Type: Solution
Last Modified: 03 Jul 2024
Version:  4
Find answers to your questions from other Dell users
Support Services
Check if your device is covered by Support Services.