PowerPath/VE : Message de fonctionnement inattendu de VMware ESXi : « #PF exception 14 dans le monde vmm0 »
Summary: VMware ESXi #PF Exception 14
Symptoms
Système d’exploitation : VMware ESXi 6.5.0 build
Dell Software : PowerPath/VE 6.3 (Build 105)
Logiciel Dell : PowerPath/VE 6.4 (Build 103)
Logiciel Dell : PowerPath/VE 6.5 (Build 110)
Matériel Dell : Symmetrix
Fonctionnement inattendu inattendu du serveur VMware ESXi sans événement déclencheur apparent
PowerPath/VE et Symmetrix exécutant le code 5978 ou une version ultérieure sont requis pour être exposés à ce problème.
2019-06-11T05:56:03.906Z cpu23:47993633)@BlueScreen: #PF Exception 14 in world 47993633:vmm0:FRAJXSA IP 0x418024500c9a addr 0x410006dcffc4 PTEs:0x8000853023;0x800082e023;0x80008a0023;0x0; 2019-06-11T05:56:03.907Z cpu23:47993633)Code start: 0x418024200000 VMK uptime: 69:00:05:14.200 2019-06-11T05:56:03.907Z cpu23:47993633)0x43941909bb50:[0x418024500c9a]Sched_SysServiceDone@vmkernel#nover+0x8a stack: 0x439dcb2afe80 2019-06-11T05:56:03.907Z cpu23:47993633)0x43941909bbb0:[0x4180245360ce]SCSICompleteAdapterCommand@vmkernel#nover+0x152 stack: 0x410006dd0040 2019-06-11T05:56:03.908Z cpu23:47993633)0x43941909bc30:[0x418024b69a09]SCSILinuxWorldletFn@com.vmware.driverAPI#9.2+0x3f1 stack: 0x4180242d1a38 2019-06-11T05:56:03.908Z cpu23:47993633)0x43941909bd90:[0x418024326ea8]WorldletBHHandler@vmkernel#nover+0x478 stack: 0x0 2019-06-11T05:56:03.909Z cpu23:47993633)0x43941909bef0:[0x4180242b1cb0]BH_DrainAndDisableInterrupts@vmkernel#nover+0x100 stack: 0x0 2019-06-11T05:56:03.909Z cpu23:47993633)0x43941909bf80:[0x418024319e66]VMMVMKCall_Call@vmkernel#nover+0x196 stack: 0x43941909bfec 2019-06-11T05:56:03.910Z cpu23:47993633)0x43941909bfe0:[0x41802434b8a2]VMKVMM_ArchEnterVMKernel@vmkernel#nover+0xe stack: 0x41802434b894 2019-06-11T05:56:03.913Z cpu23:47993633)base fs=0x0 gs=0x418045c00000 Kgs=0x0 2019-06-24T08:43:40.022Z cpu17:169970)@BlueScreen: #PF Exception 14 in world 169970:vmm0:FRAWINE IP 0x41802f30155a addr 0x410006d6ffc4 PTEs:0x8000053023;0x800002b023;0x800009e023;0x0; 2019-06-24T08:43:40.023Z cpu17:169970)Code start: 0x41802f000000 VMK uptime: 6:00:01:30.899 2019-06-24T08:43:40.023Z cpu17:169970)0x43923f91bd30:[0x41802f30155a]Sched_SysServiceDone@vmkernel#nover+0x8a stack: 0xfc40a085 2019-06-24T08:43:40.023Z cpu17:169970)0x43923f91bd90:[0x41802f126e31]WorldletBHHandler@vmkernel#nover+0xe1 stack: 0x418042800c00 2019-06-24T08:43:40.024Z cpu17:169970)0x43923f91bef0:[0x41802f0b1db0]BH_DrainAndDisableInterrupts@vmkernel#nover+0x100 stack: 0x0 2019-06-24T08:43:40.024Z cpu17:169970)0x43923f91bf80:[0x41802f11a186]VMMVMKCall_Call@vmkernel#nover+0x196 stack: 0x43923f91bfec 2019-06-24T08:43:40.025Z cpu17:169970)0x43923f91bfe0:[0x41802f14b8a2]VMKVMM_ArchEnterVMKernel@vmkernel#nover+0xe stack: 0x41802f14b894 2019-06-24T08:43:40.028Z cpu17:169970)base fs=0x0 gs=0x418044400000 Kgs=0x0
Cause
Les ingénieurs VMware ont déterminé que ce problème est dû à une anomalie de préemption entraînant un fonctionnement inattendu du contexte dans SchedSysServiceContextPut().
PowerPath/VE for VMware 6.3, 6.4 et 6.5 présente un problème dans sa fonction d’impression digitale de l’application qui peut entraîner une anomalie de préemption.
Resolution
Lors du dépannage de ce problème en interne, un problème PowerPath/VE lié à la fonction d’empreintes digitales de l’application a été découvert. Bien que nous ne puissions pas être sûrs à 100 % qu’il s’agit de la cause de la panique observée par l’utilisateur, par mesure de précaution, nous recommandons à tout utilisateur ayant connu ce type de panique de désactiver la fonction d’empreinte digitale de l’application.
Solution de contournement (applicable uniquement si le microcode Symmetrix est inférieur à 5978.221) :
Désactivez l’empreinte digitale de l’application.
Résolution:
Effectuez une mise à niveau vers PowerPath/VE 7.0 P01 ou une version supérieure, actuellement disponible au téléchargement sur le site Web de support Dell.
Additional Information
Vous trouverez ci-dessous les commandes rpowermt permettant d’afficher et de désactiver la fonction d’empreinte digitale de l’application.
Pour vérifier si la fonctionnalité est activée :
# rpowermt display options host=<ESXi host name/IP> Show CLARiiON LUN names: true Path Latency Monitor: Off Performance Monitor: disabled Autostandby: IOs per Failure (iopf): enabled iopf aging period : 1 d iopf limit : 6000 Storage System Class Attributes ------------ ---------- Symmetrix periodic autorestore = on reactive autorestore = on auto host registration = enabled app finger printing = enabled device to array performance report = enabled device in use to array report = enabled
Pour désactiver la fonctionnalité :
# rpowermt set app_finger_printing=off host=<ESXi host name/IP>
Pour vérifier si la fonctionnalité est désactivée :
# rpowermt display options host=<ESXi host name/IP> Show CLARiiON LUN names: true Path Latency Monitor: Off Performance Monitor: disabled Autostandby: IOs per Failure (iopf): enabled iopf aging period : 1 d iopf limit : 6000 Storage System Class Attributes ------------ ---------- Symmetrix periodic autorestore = on reactive autorestore = on auto host registration = enabled app finger printing = disabled device to array performance report = enabled device in use to array report = enabled
- Cette fonctionnalité d’activation/désactivation ne nécessite aucune activité de maintenance sur les hôtes ESXi et est persistante lors des redémarrages.
- Aucune modification n’est requise du côté de la baie associée à cette fonctionnalité.
- Cette solution de contournement s’applique uniquement au microcode Symmetrix antérieur à la version 5978.221.
- À partir du microcode Symmetrix 5978.221 et versions ultérieures, le balisage d’E/S est activé sur le Symmetrix, ce qui déclenche un défaut dans PowerPath/VE entraînant un écran PSOD.