PowerPath/VE: Messaggio di errore irreversibile VMware ESXi: "#PF eccezione 14 nel mondo vmm0"
Summary: Eccezione VMware ESXi #PF 14
Symptoms
Sistema operativo: Build
VMware ESXi 6.5.0 Software Dell: PowerPath/VE 6.3 (build 105)
Software Dell: PowerPath/VE 6.4 (build 103)
Software Dell: PowerPath/VE 6.5 (build 110)
Hardware Dell: Symmetrix
Errore irreversibile imprevisto del server VMware ESXi senza evento trigger apparente
Per essere esposti a questo problema, è necessario PowerPath/VE e Symmetrix con codice 5978 o versione successiva.
2019-06-11T05:56:03.906Z cpu23:47993633)@BlueScreen: #PF Exception 14 in world 47993633:vmm0:FRAJXSA IP 0x418024500c9a addr 0x410006dcffc4 PTEs:0x8000853023;0x800082e023;0x80008a0023;0x0; 2019-06-11T05:56:03.907Z cpu23:47993633)Code start: 0x418024200000 VMK uptime: 69:00:05:14.200 2019-06-11T05:56:03.907Z cpu23:47993633)0x43941909bb50:[0x418024500c9a]Sched_SysServiceDone@vmkernel#nover+0x8a stack: 0x439dcb2afe80 2019-06-11T05:56:03.907Z cpu23:47993633)0x43941909bbb0:[0x4180245360ce]SCSICompleteAdapterCommand@vmkernel#nover+0x152 stack: 0x410006dd0040 2019-06-11T05:56:03.908Z cpu23:47993633)0x43941909bc30:[0x418024b69a09]SCSILinuxWorldletFn@com.vmware.driverAPI#9.2+0x3f1 stack: 0x4180242d1a38 2019-06-11T05:56:03.908Z cpu23:47993633)0x43941909bd90:[0x418024326ea8]WorldletBHHandler@vmkernel#nover+0x478 stack: 0x0 2019-06-11T05:56:03.909Z cpu23:47993633)0x43941909bef0:[0x4180242b1cb0]BH_DrainAndDisableInterrupts@vmkernel#nover+0x100 stack: 0x0 2019-06-11T05:56:03.909Z cpu23:47993633)0x43941909bf80:[0x418024319e66]VMMVMKCall_Call@vmkernel#nover+0x196 stack: 0x43941909bfec 2019-06-11T05:56:03.910Z cpu23:47993633)0x43941909bfe0:[0x41802434b8a2]VMKVMM_ArchEnterVMKernel@vmkernel#nover+0xe stack: 0x41802434b894 2019-06-11T05:56:03.913Z cpu23:47993633)base fs=0x0 gs=0x418045c00000 Kgs=0x0 2019-06-24T08:43:40.022Z cpu17:169970)@BlueScreen: #PF Exception 14 in world 169970:vmm0:FRAWINE IP 0x41802f30155a addr 0x410006d6ffc4 PTEs:0x8000053023;0x800002b023;0x800009e023;0x0; 2019-06-24T08:43:40.023Z cpu17:169970)Code start: 0x41802f000000 VMK uptime: 6:00:01:30.899 2019-06-24T08:43:40.023Z cpu17:169970)0x43923f91bd30:[0x41802f30155a]Sched_SysServiceDone@vmkernel#nover+0x8a stack: 0xfc40a085 2019-06-24T08:43:40.023Z cpu17:169970)0x43923f91bd90:[0x41802f126e31]WorldletBHHandler@vmkernel#nover+0xe1 stack: 0x418042800c00 2019-06-24T08:43:40.024Z cpu17:169970)0x43923f91bef0:[0x41802f0b1db0]BH_DrainAndDisableInterrupts@vmkernel#nover+0x100 stack: 0x0 2019-06-24T08:43:40.024Z cpu17:169970)0x43923f91bf80:[0x41802f11a186]VMMVMKCall_Call@vmkernel#nover+0x196 stack: 0x43923f91bfec 2019-06-24T08:43:40.025Z cpu17:169970)0x43923f91bfe0:[0x41802f14b8a2]VMKVMM_ArchEnterVMKernel@vmkernel#nover+0xe stack: 0x41802f14b894 2019-06-24T08:43:40.028Z cpu17:169970)base fs=0x0 gs=0x418044400000 Kgs=0x0
Cause
VMware Engineering ha stabilito che questo problema è causato da un'anomalia di prelazione con conseguente errore irreversibile del contesto casuale in SchedSysServiceContextPut().
PowerPath/VE for VMware 6.3, 6.4 e 6.5 presenta un problema nella funzione di impronte digitali dell'app che potrebbe causare un'anomalia di interruzione per diritti di priorità.
Resolution
Durante la risoluzione interna di questo problema, è stato rilevato un problema di PowerPath/VE correlato alla funzione di impronte digitali dell'app. Anche se non possiamo essere certi al 100% che sia la causa del panico visto dall'utente, per precauzione consigliamo a tutti gli utenti che hanno sperimentato questo tipo di panico di disabilitare la funzione di impronte digitali dell'app.
Soluzione alternativa (applicabile solo se al di sotto del microcodice Symmetrix 5978.221):
Disabilita l'impronta digitale delle app.
Risoluzione:
Eseguire l'aggiornamento a PowerPath/VE 7.0 P01 o versione successiva, attualmente disponibile per il download sul sito web del supporto Dell.
Additional Information
Di seguito sono riportati i comandi rpowermt per visualizzare e disabilitare la funzione "app finger printing".
Per verificare se la funzione è abilitata:
# rpowermt display options host=<ESXi host name/IP> Show CLARiiON LUN names: true Path Latency Monitor: Off Performance Monitor: disabled Autostandby: IOs per Failure (iopf): enabled iopf aging period : 1 d iopf limit : 6000 Storage System Class Attributes ------------ ---------- Symmetrix periodic autorestore = on reactive autorestore = on auto host registration = enabled app finger printing = enabled device to array performance report = enabled device in use to array report = enabled
Per disattivare la funzione:
# rpowermt set app_finger_printing=off host=<ESXi host name/IP>
Per verificare se la funzione è disabilitata:
# rpowermt display options host=<ESXi host name/IP> Show CLARiiON LUN names: true Path Latency Monitor: Off Performance Monitor: disabled Autostandby: IOs per Failure (iopf): enabled iopf aging period : 1 d iopf limit : 6000 Storage System Class Attributes ------------ ---------- Symmetrix periodic autorestore = on reactive autorestore = on auto host registration = enabled app finger printing = disabled device to array performance report = enabled device in use to array report = enabled
- L'abilitazione/disabilitazione di questa funzione non richiede alcuna attività di manutenzione sugli host ESXi ed è persistente tra i riavvii.
- Non sono richieste modifiche sul lato array associato a questa funzione.
- Questa soluzione alternativa è applicabile solo per il microcodice Symmetrix inferiore a 5978.221.
- A partire dal microcodice Symmetrix 5978.221 e versioni successive, l'etichettatura di I/O è abilitata su Symmetrix, il che attiva un difetto in PowerPath/VE che causa un PSOD.