PowerPath dla AIX powoduje, że host przestaje odpowiadać lub uruchamia się ponownie po instalacji PowerPath 7.0 lub PowerPath 7.0 P01
Summary: PowerPath dla AIX powoduje nieoczekiwany restart hosta codziennie około północy po instalacji (lub uaktualnieniu) PowerPath 7.0 lub PowerPath 7.0 P01.
Symptoms
Środowisko:
Oprogramowanie Dell EMC: PowerPath 7.0 dla AIX lub PowerPath 7.0 P01 dla AIX
Oprogramowanie inne niż Dell EMC: Instancja Oracle zainstalowana na starszej pamięci masowej Dell EMC (pamięć masowa Dell zarządzana przez macierz PowerPath-VMAX z mikrokodem poniżej 5978, Unity, VNX, VPLEX, PowerStore, XtremIO itd.)
Wiersz, taki jak "0 0 * * * /etc/emc/bin/oracleinstance" znajduje się w crontab /var/spool/cron/crontabs/root.
Objawy:
Ręczne uruchomienie /etc/emc/bin/oracleinstance powoduje, że host przestaje odpowiadać lub uruchamia się ponownie (nie próbuj!)
Host przestaje odpowiadać i nieoczekiwanie uruchamia się ponownie każdego dnia około północy. Analiza zrzutu pokazuje, że problem występuje po wywołaniu funkcji MpxSetDevOrainstMap .
Na zrzucie wyświetlane są następujące informacje:
CRASH INFORMATION:
CPU 16 CSA F0xxxxxxxxxxxxxx at time of crash, error code for LEDs: 30000000
pvthread+194300 STACK:
[0000F434]___memmove64+000034 ()
[F1000000C049EE38]MpxSetDevOrainstMap+000138 (F1000C0310327E80, 0000000000000060)
[F1000000C04A90C8]MpxIocmd+0004C8 (0000015300000153, F1000C0310327E80,
0000006000000060)
[F1000000C041517C]EmcpIocmd+0001FC (F00000002FF46B88, 0000015300000153,
F1000C0310327E80, 0000006000000060)
[F1000000C042086C]power_ioctl+0003AC (8000000F00000000, 0000000400000004,
000000002FF22998, 0000000000000003, 0000000000000000, 0000000000000000)
[00014D70].hkey_legacy_gate+00004C ()
[006A5D38]rdevioctl+0000B8 (??, ??, ??, ??, ??, ??)
[008E3F2C]spec_ioctl+00008C (??, ??, ??, ??, ??, ??)
[00704658]vnop_ioctl+000058 (??, ??, ??, ??, ??, ??)
[0071E774]vno_ioctl+0001B4 (??, ??, ??, ??, ??)
[007CF1F4]common_ioctl+000114 (??, ??, ??, ??)
[0000394C]syscall+000244 ()
[kdb_get_virtual_memory] no real storage @ 2FF228A8
[D011CA6C]D011CA6C ()
[kdb_read_mem] no real storage @ FFFFFFFFFFF60F0
Cause
Lista ta jest tworzona nawet wtedy, gdy do hosta nie jest podłączona żadna macierz PowerMax. Powoduje to, że host przestaje reagować (z powodu problemu), gdy macierz nie obsługuje tej funkcji.
Resolution
Proste obejście problemu polega na usunięciu lub zakomentarzowaniu wpisu crontab dla /etc/emc/bin/oracleinstance jako roota w /var/spool/cron/crontabs/root. Można uruchomić polecenie crontab -e root . Domyślnie wywołuje vi w głównym pliku crontab, a wpis może być następnie usunięty. Zobacz man crontab , aby dowiedzieć się więcej.
Nuta: Usunięcie tego wpisu nie ma negatywnego wpływu, zwłaszcza jeśli nie istnieje pamięć masowa PowerMax (z mikrokodem 5978 i nowszym) obsługująca instancję Oracle. Jeśli skrypt zostanie usunięty, gdy Oracle korzysta z urządzeń PowerMax, urządzenia Oracle mają taką samą wydajność jak wszystkie inne urządzenia w macierzy.
Rezolucja:
Problem ten rozwiązuje PowerPath dla AIX 7.0 P02 i nowsze wersje.
Additional Information
| Numer problemu | Podsumowanie problemu | Znaleziono w wersji | Naprawiono w wersji |
|---|---|---|---|
| PPAI-783 | Unikaj awarii hosta i wyświetlaj komunikat ostrzegawczy w przypadku, gdy konfiguracja przekracza maksymalną liczbę ścieżek obsługiwanych przez urządzenie. | 7,0 | 7.0 P02 |
| PPEE-711 | Podczas LPM systemu AIX wyświetlany jest komunikat "E9595B51 0914221120 I S powerpath0 CONTROL POINT FAILURE" | 7,0 | 7.0 P02 |
| PPAI-683 | Awaria hosta AIX spowodowana przez funkcję Oracle Instance Name | 7,0 | 7.0 P02 |
| PPAI-671 | Wszystkie polecenia pprootdev kończą się niepowodzeniem z błędem "/usr/sbin/pprootdev[15]: (requiredSpaceavailableliableSpace)* 2: 0403-009 Podany numer nie jest prawidłowy dla tego polecenia." |
7,0 | 7.0 P02 |
| PPEE-583 | Konsola zarządzania PowerPath traci komunikację z urządzeniem każdego dnia. | 7,0 | 7.0 P02 |
| PPAI-618 | PowerPath: powerdd: MpxPeriodicCallbackDaemon spowodował niepowodzenie AIX i uruchomił się ponownie. | 6.4 | 7,0 |