PowerPath/VE: Komunikat błędu VMware ESXi: "#PF Wyjątek 14 w świecie vmm0"
Summary: VMware ESXi #PF wyjątek 14
Symptoms
OS: Kompilacja
VMware ESXi 6.5.0 Dell Software: PowerPath/VE 6.3 (kompilacja 105)
Oprogramowanie firmy Dell: PowerPath/VE 6.4 (kompilacja 103)
— oprogramowanie firmy Dell: PowerPath/VE 6.5 (kompilacja 110)
— sprzęt firmy Dell: Symmetrix
Nieoczekiwana awaria serwera VMware ESXi bez widocznego zdarzenia wyzwalającego
Aby być narażonym na ten problem, wymagane są PowerPath/VE i Symmetrix z kodem 5978 lub nowszym.
2019-06-11T05:56:03.906Z cpu23:47993633)@BlueScreen: #PF Exception 14 in world 47993633:vmm0:FRAJXSA IP 0x418024500c9a addr 0x410006dcffc4 PTEs:0x8000853023;0x800082e023;0x80008a0023;0x0; 2019-06-11T05:56:03.907Z cpu23:47993633)Code start: 0x418024200000 VMK uptime: 69:00:05:14.200 2019-06-11T05:56:03.907Z cpu23:47993633)0x43941909bb50:[0x418024500c9a]Sched_SysServiceDone@vmkernel#nover+0x8a stack: 0x439dcb2afe80 2019-06-11T05:56:03.907Z cpu23:47993633)0x43941909bbb0:[0x4180245360ce]SCSICompleteAdapterCommand@vmkernel#nover+0x152 stack: 0x410006dd0040 2019-06-11T05:56:03.908Z cpu23:47993633)0x43941909bc30:[0x418024b69a09]SCSILinuxWorldletFn@com.vmware.driverAPI#9.2+0x3f1 stack: 0x4180242d1a38 2019-06-11T05:56:03.908Z cpu23:47993633)0x43941909bd90:[0x418024326ea8]WorldletBHHandler@vmkernel#nover+0x478 stack: 0x0 2019-06-11T05:56:03.909Z cpu23:47993633)0x43941909bef0:[0x4180242b1cb0]BH_DrainAndDisableInterrupts@vmkernel#nover+0x100 stack: 0x0 2019-06-11T05:56:03.909Z cpu23:47993633)0x43941909bf80:[0x418024319e66]VMMVMKCall_Call@vmkernel#nover+0x196 stack: 0x43941909bfec 2019-06-11T05:56:03.910Z cpu23:47993633)0x43941909bfe0:[0x41802434b8a2]VMKVMM_ArchEnterVMKernel@vmkernel#nover+0xe stack: 0x41802434b894 2019-06-11T05:56:03.913Z cpu23:47993633)base fs=0x0 gs=0x418045c00000 Kgs=0x0 2019-06-24T08:43:40.022Z cpu17:169970)@BlueScreen: #PF Exception 14 in world 169970:vmm0:FRAWINE IP 0x41802f30155a addr 0x410006d6ffc4 PTEs:0x8000053023;0x800002b023;0x800009e023;0x0; 2019-06-24T08:43:40.023Z cpu17:169970)Code start: 0x41802f000000 VMK uptime: 6:00:01:30.899 2019-06-24T08:43:40.023Z cpu17:169970)0x43923f91bd30:[0x41802f30155a]Sched_SysServiceDone@vmkernel#nover+0x8a stack: 0xfc40a085 2019-06-24T08:43:40.023Z cpu17:169970)0x43923f91bd90:[0x41802f126e31]WorldletBHHandler@vmkernel#nover+0xe1 stack: 0x418042800c00 2019-06-24T08:43:40.024Z cpu17:169970)0x43923f91bef0:[0x41802f0b1db0]BH_DrainAndDisableInterrupts@vmkernel#nover+0x100 stack: 0x0 2019-06-24T08:43:40.024Z cpu17:169970)0x43923f91bf80:[0x41802f11a186]VMMVMKCall_Call@vmkernel#nover+0x196 stack: 0x43923f91bfec 2019-06-24T08:43:40.025Z cpu17:169970)0x43923f91bfe0:[0x41802f14b8a2]VMKVMM_ArchEnterVMKernel@vmkernel#nover+0xe stack: 0x41802f14b894 2019-06-24T08:43:40.028Z cpu17:169970)base fs=0x0 gs=0x418044400000 Kgs=0x0
Cause
Inżynierowie VMware ustalili, że przyczyną tego problemu jest anomalia wywłaszczania skutkująca losową paniką kontekstową w funkcji SchedSysServiceContextPut().
PowerPath/VE dla VMware 6.3, 6.4 i 6.5 ma problem z funkcją czytnika linii papilarnych aplikacji, który może spowodować anomalię wywłaszczania.
Resolution
Podczas wewnętrznego rozwiązywania tego problemu wykryto problem PowerPath/VE związany z funkcją odcisku palca w aplikacji. Chociaż nie możemy być w 100% pewni, że jest to przyczyna paniki widzianej przez użytkownika, jako środek ostrożności zalecamy każdemu użytkownikowi, który doświadczył tego typu błędu, wyłączenie funkcji odcisku palca w aplikacji.
Obejście problemu (Dotyczy tylko mikrokodu Symmetrix 5978.221):
Wyłącz funkcję pobierania odcisków palców przez aplikację.
Rezolucja:
Uaktualnij do wersji PowerPath/VE 7.0 P01 lub nowszej, które są obecnie dostępne do pobrania w witrynie pomocy technicznej firmy Dell.
Additional Information
Poniżej znajdują się polecenia rpowermt służące do wyświetlania i wyłączania funkcji "app finger printing".
Aby sprawdzić, czy funkcja jest włączona:
# rpowermt display options host=<ESXi host name/IP> Show CLARiiON LUN names: true Path Latency Monitor: Off Performance Monitor: disabled Autostandby: IOs per Failure (iopf): enabled iopf aging period : 1 d iopf limit : 6000 Storage System Class Attributes ------------ ---------- Symmetrix periodic autorestore = on reactive autorestore = on auto host registration = enabled app finger printing = enabled device to array performance report = enabled device in use to array report = enabled
Aby wyłączyć tę funkcję:
# rpowermt set app_finger_printing=off host=<ESXi host name/IP>
Aby sprawdzić, czy funkcja jest wyłączona:
# rpowermt display options host=<ESXi host name/IP> Show CLARiiON LUN names: true Path Latency Monitor: Off Performance Monitor: disabled Autostandby: IOs per Failure (iopf): enabled iopf aging period : 1 d iopf limit : 6000 Storage System Class Attributes ------------ ---------- Symmetrix periodic autorestore = on reactive autorestore = on auto host registration = enabled app finger printing = disabled device to array performance report = enabled device in use to array report = enabled
- Włączanie/wyłączanie tej funkcji nie wymaga żadnych działań konserwacyjnych na hostach ESXi i jest trwałe po ponownym uruchomieniu.
- Nie są wymagane żadne zmiany po stronie macierzy skojarzonej z tą funkcją.
- To obejście dotyczy tylko mikrokodu Symmetrix poniżej 5978.221.
- Począwszy od mikrokodu Symmetrix 5978.221 i nowszych, znakowanie we/wy jest włączone w Symmetrix, co wyzwala defekt w PowerPath/VE, który powoduje PSOD.