PowerPath/VE: VMware ESXi-Fehlermeldung: "#PF Ausnahme 14 in der Welt vmm0"
Summary: VMware ESXi #PF Ausnahme 14
Symptoms
Betriebssystem: VMware ESXi 6.5.0 Build
Dell Software: PowerPath/VE 6.3 (Build 105)
Dell Software: PowerPath/VE 6.4 (Build 103)
Dell Software: PowerPath/VE 6.5 (Build 110)
Dell Hardware: Symmetrix
Unerwarteter VMware ESXi-Serverfehler ohne offensichtliches Auslöseereignis
PowerPath/VE und Symmetrix mit 5978-Code oder höher sind erforderlich, um diesem Problem ausgesetzt zu sein.
2019-06-11T05:56:03.906Z cpu23:47993633)@BlueScreen: #PF Exception 14 in world 47993633:vmm0:FRAJXSA IP 0x418024500c9a addr 0x410006dcffc4 PTEs:0x8000853023;0x800082e023;0x80008a0023;0x0; 2019-06-11T05:56:03.907Z cpu23:47993633)Code start: 0x418024200000 VMK uptime: 69:00:05:14.200 2019-06-11T05:56:03.907Z cpu23:47993633)0x43941909bb50:[0x418024500c9a]Sched_SysServiceDone@vmkernel#nover+0x8a stack: 0x439dcb2afe80 2019-06-11T05:56:03.907Z cpu23:47993633)0x43941909bbb0:[0x4180245360ce]SCSICompleteAdapterCommand@vmkernel#nover+0x152 stack: 0x410006dd0040 2019-06-11T05:56:03.908Z cpu23:47993633)0x43941909bc30:[0x418024b69a09]SCSILinuxWorldletFn@com.vmware.driverAPI#9.2+0x3f1 stack: 0x4180242d1a38 2019-06-11T05:56:03.908Z cpu23:47993633)0x43941909bd90:[0x418024326ea8]WorldletBHHandler@vmkernel#nover+0x478 stack: 0x0 2019-06-11T05:56:03.909Z cpu23:47993633)0x43941909bef0:[0x4180242b1cb0]BH_DrainAndDisableInterrupts@vmkernel#nover+0x100 stack: 0x0 2019-06-11T05:56:03.909Z cpu23:47993633)0x43941909bf80:[0x418024319e66]VMMVMKCall_Call@vmkernel#nover+0x196 stack: 0x43941909bfec 2019-06-11T05:56:03.910Z cpu23:47993633)0x43941909bfe0:[0x41802434b8a2]VMKVMM_ArchEnterVMKernel@vmkernel#nover+0xe stack: 0x41802434b894 2019-06-11T05:56:03.913Z cpu23:47993633)base fs=0x0 gs=0x418045c00000 Kgs=0x0 2019-06-24T08:43:40.022Z cpu17:169970)@BlueScreen: #PF Exception 14 in world 169970:vmm0:FRAWINE IP 0x41802f30155a addr 0x410006d6ffc4 PTEs:0x8000053023;0x800002b023;0x800009e023;0x0; 2019-06-24T08:43:40.023Z cpu17:169970)Code start: 0x41802f000000 VMK uptime: 6:00:01:30.899 2019-06-24T08:43:40.023Z cpu17:169970)0x43923f91bd30:[0x41802f30155a]Sched_SysServiceDone@vmkernel#nover+0x8a stack: 0xfc40a085 2019-06-24T08:43:40.023Z cpu17:169970)0x43923f91bd90:[0x41802f126e31]WorldletBHHandler@vmkernel#nover+0xe1 stack: 0x418042800c00 2019-06-24T08:43:40.024Z cpu17:169970)0x43923f91bef0:[0x41802f0b1db0]BH_DrainAndDisableInterrupts@vmkernel#nover+0x100 stack: 0x0 2019-06-24T08:43:40.024Z cpu17:169970)0x43923f91bf80:[0x41802f11a186]VMMVMKCall_Call@vmkernel#nover+0x196 stack: 0x43923f91bfec 2019-06-24T08:43:40.025Z cpu17:169970)0x43923f91bfe0:[0x41802f14b8a2]VMKVMM_ArchEnterVMKernel@vmkernel#nover+0xe stack: 0x41802f14b894 2019-06-24T08:43:40.028Z cpu17:169970)base fs=0x0 gs=0x418044400000 Kgs=0x0
Cause
VMware Engineering hat festgestellt, dass dieses Problem durch eine Präemptionsanomalie verursacht wird, die zu einem zufälligen Kontextfehler in SchedSysServiceContextPut() führt.
In PowerPath/VE for VMware 6.3, 6.4 und 6.5 ist ein Problem mit der Fingerabdruckfunktion der App aufgetreten, das zu einer Anomalie beim vorzeitigen Trennen führen kann.
Resolution
Beim internen Troubleshooting dieses Problems wurde ein PowerPath/VE-Problem im Zusammenhang mit der Fingerabdruckfunktion der App entdeckt. Obwohl wir nicht zu 100 % sicher sein können, dass dies die Ursache für die Panik des Benutzers ist, empfehlen wir als Vorsichtsmaßnahme jedem Benutzer, der diese Art von Panik erlebt hat, die Fingerabdruckfunktion der App zu deaktivieren.
Workaround (gilt nur, wenn unterhalb von Symmetrix-Mikrocode 5978.221):
Deaktivieren Sie den Fingerabdruck der App.
Auflösung:
Führen Sie ein Upgrade auf PowerPath/VE 7.0 P01 oder höher durch, die derzeit auf der Dell Supportwebsite zum Download verfügbar sind.
Additional Information
Im Folgenden finden Sie die rpowermt-Befehle zum Anzeigen und Deaktivieren der Funktion "App-Fingerabdruck".
So überprüfen Sie, ob die Funktion aktiviert ist:
# rpowermt display options host=<ESXi host name/IP> Show CLARiiON LUN names: true Path Latency Monitor: Off Performance Monitor: disabled Autostandby: IOs per Failure (iopf): enabled iopf aging period : 1 d iopf limit : 6000 Storage System Class Attributes ------------ ---------- Symmetrix periodic autorestore = on reactive autorestore = on auto host registration = enabled app finger printing = enabled device to array performance report = enabled device in use to array report = enabled
So deaktivieren Sie die Funktion:
# rpowermt set app_finger_printing=off host=<ESXi host name/IP>
So überprüfen Sie, ob die Funktion deaktiviert ist:
# rpowermt display options host=<ESXi host name/IP> Show CLARiiON LUN names: true Path Latency Monitor: Off Performance Monitor: disabled Autostandby: IOs per Failure (iopf): enabled iopf aging period : 1 d iopf limit : 6000 Storage System Class Attributes ------------ ---------- Symmetrix periodic autorestore = on reactive autorestore = on auto host registration = enabled app finger printing = disabled device to array performance report = enabled device in use to array report = enabled
- Diese Funktion zum Aktivieren/Deaktivieren erfordert keine Wartungsaktivität auf ESXi-Hosts und bleibt über Neustarts hinweg bestehen.
- Es sind keine Änderungen auf der Arrayseite im Zusammenhang mit dieser Funktion erforderlich.
- Dieser Workaround gilt nur für Symmetrix-Mikrocode unter 5978.221.
- Ab Symmetrix-Mikrocode 5978.221 und höher ist das I/O-Tagging auf der Symmetrix aktiviert, was einen Fehler in PowerPath/VE auslöst, der einen PSOD verursacht.