PowerPath for AIX causa l'interruzione della risposta o il riavvio di un host dopo l'installazione di PowerPath 7.0 o PowerPath 7.0 P01
Summary: PowerPath for AIX causa un riavvio imprevisto dell'host ogni giorno intorno a mezzanotte dopo l'installazione (o un aggiornamento) di PowerPath 7.0 o PowerPath 7.0 P01.
Symptoms
Ambiente:
Software Dell EMC: PowerPath 7.0 per AIX o PowerPath 7.0 P01 per AIX
SW non Dell EMC: Istanza Oracle installata su storage legacy Dell EMC (storage Dell gestito da array PowerPath-VMAX con microcodice inferiore a 5978, Unity, VNX, VPLEX, PowerStore, XtremIO e così via)
Una riga come "0 0 * * * /etc/emc/bin/oracleinstance" si trova in crontab /var/spool/cron/crontabs/root.
Sintomi:
L'esecuzione manuale di /etc/emc/bin/oracleinstance causa l'interruzione della risposta o il riavvio di un host (non provare!)
L'host smette di rispondere e si riavvia in modo imprevisto ogni giorno intorno a mezzanotte. Un'analisi del dump rivela che il problema si verifica dopo aver richiamato la funzione MpxSetDevOrainstMap .
Nel dump viene visualizzato quanto segue:
CRASH INFORMATION:
CPU 16 CSA F0xxxxxxxxxxxxxx at time of crash, error code for LEDs: 30000000
pvthread+194300 STACK:
[0000F434]___memmove64+000034 ()
[F1000000C049EE38]MpxSetDevOrainstMap+000138 (F1000C0310327E80, 0000000000000060)
[F1000000C04A90C8]MpxIocmd+0004C8 (0000015300000153, F1000C0310327E80,
0000006000000060)
[F1000000C041517C]EmcpIocmd+0001FC (F00000002FF46B88, 0000015300000153,
F1000C0310327E80, 0000006000000060)
[F1000000C042086C]power_ioctl+0003AC (8000000F00000000, 0000000400000004,
000000002FF22998, 0000000000000003, 0000000000000000, 0000000000000000)
[00014D70].hkey_legacy_gate+00004C ()
[006A5D38]rdevioctl+0000B8 (??, ??, ??, ??, ??, ??)
[008E3F2C]spec_ioctl+00008C (??, ??, ??, ??, ??, ??)
[00704658]vnop_ioctl+000058 (??, ??, ??, ??, ??, ??)
[0071E774]vno_ioctl+0001B4 (??, ??, ??, ??, ??)
[007CF1F4]common_ioctl+000114 (??, ??, ??, ??)
[0000394C]syscall+000244 ()
[kdb_get_virtual_memory] no real storage @ 2FF228A8
[D011CA6C]D011CA6C ()
[kdb_read_mem] no real storage @ FFFFFFFFFFF60F0
Cause
Questo elenco viene creato anche quando non è presente alcun array PowerMax collegato all host. Di conseguenza, un host smette di rispondere (a causa di un problema) quando l'array non supporta la funzione.
Resolution
Una semplice soluzione consiste nel rimuovere o commentare la voce crontab per /etc/emc/bin/oracleinstance come root in /var/spool/cron/crontabs/root. È possibile eseguire un comando crontab -e root . Invoca vi per impostazione predefinita sul file crontab root e la voce può quindi essere eliminata. Vedere man crontab per maggiori dettagli.
Nota: La rimozione di questa voce non ha alcun effetto negativo, soprattutto se non è presente uno storage PowerMax (con microcodice 5978 e versioni successive) che supporta l'istanza Oracle. Se lo script viene rimosso mentre Oracle utilizza dispositivi PowerMax, i dispositivi Oracle avranno le stesse prestazioni di qualsiasi altro dispositivo nell'array.
Risoluzione:
PowerPath per AIX 7.0 P02 e versioni successive risolvono questo problema.
Additional Information
| Numero del problema | Riepilogo del problema | Trovato nella versione | Risolto nella versione |
|---|---|---|---|
| PPAI-783 | Evitare l'arresto anomalo dell host e visualizzare un messaggio di avvertenza nel caso in cui la configurazione superi il numero massimo di percorsi supportati per dispositivo. | 7.0 | 7.0 P02 |
| PPEE-711 | Durante un LPM AIX, viene visualizzato il messaggio "E9595B51 0914221120 I S powerpath0 CONTROL POINT FAILURE" | 7.0 | 7.0 P02 |
| PPAI-683 | Arresto anomalo dell host AIX causato dalla funzionalità Oracle Instance Name | 7.0 | 7.0 P02 |
| PPAI-671 | Tutti i comandi di pprootdev falliscono con "/usr/sbin/pprootdev[15]: (richiestoSpaceavaliableSpace)* 2: 0403-009 Il numero specificato non è valido per questo comando." |
7.0 | 7.0 P02 |
| PPEE-583 | La console di gestione PowerPath perde quotidianamente la comunicazione con l'appliance. | 7.0 | 7.0 P02 |
| PPAI-618 | PowerPath: powerdd: MpxPeriodicCallbackDaemon ha causato l'errore e il riavvio di AIX. | 6,4 | 7.0 |