PowerPath/VE: Mensagem de pane no VMware ESXi: "#PF Exceção 14 no mundo vmm0"
Summary: Exceção 14 do VMware ESXi #PF
Symptoms
OS: VMware ESXi 6.5.0 compilação
de software Dell: PowerPath/VE 6.3 (compilação 105)
Software Dell: PowerPath/VE 6.4 (compilação 103)
Software Dell: PowerPath/VE 6.5 (compilação 110)
Hardware Dell: Symmetrix
Pane inesperada do servidor VMware ESXi sem evento de acionamento aparente
O PowerPath/VE e o Symmetrix que executam o código 5978 ou posterior são necessários para serem expostos a esse problema.
2019-06-11T05:56:03.906Z cpu23:47993633)@BlueScreen: #PF Exception 14 in world 47993633:vmm0:FRAJXSA IP 0x418024500c9a addr 0x410006dcffc4 PTEs:0x8000853023;0x800082e023;0x80008a0023;0x0; 2019-06-11T05:56:03.907Z cpu23:47993633)Code start: 0x418024200000 VMK uptime: 69:00:05:14.200 2019-06-11T05:56:03.907Z cpu23:47993633)0x43941909bb50:[0x418024500c9a]Sched_SysServiceDone@vmkernel#nover+0x8a stack: 0x439dcb2afe80 2019-06-11T05:56:03.907Z cpu23:47993633)0x43941909bbb0:[0x4180245360ce]SCSICompleteAdapterCommand@vmkernel#nover+0x152 stack: 0x410006dd0040 2019-06-11T05:56:03.908Z cpu23:47993633)0x43941909bc30:[0x418024b69a09]SCSILinuxWorldletFn@com.vmware.driverAPI#9.2+0x3f1 stack: 0x4180242d1a38 2019-06-11T05:56:03.908Z cpu23:47993633)0x43941909bd90:[0x418024326ea8]WorldletBHHandler@vmkernel#nover+0x478 stack: 0x0 2019-06-11T05:56:03.909Z cpu23:47993633)0x43941909bef0:[0x4180242b1cb0]BH_DrainAndDisableInterrupts@vmkernel#nover+0x100 stack: 0x0 2019-06-11T05:56:03.909Z cpu23:47993633)0x43941909bf80:[0x418024319e66]VMMVMKCall_Call@vmkernel#nover+0x196 stack: 0x43941909bfec 2019-06-11T05:56:03.910Z cpu23:47993633)0x43941909bfe0:[0x41802434b8a2]VMKVMM_ArchEnterVMKernel@vmkernel#nover+0xe stack: 0x41802434b894 2019-06-11T05:56:03.913Z cpu23:47993633)base fs=0x0 gs=0x418045c00000 Kgs=0x0 2019-06-24T08:43:40.022Z cpu17:169970)@BlueScreen: #PF Exception 14 in world 169970:vmm0:FRAWINE IP 0x41802f30155a addr 0x410006d6ffc4 PTEs:0x8000053023;0x800002b023;0x800009e023;0x0; 2019-06-24T08:43:40.023Z cpu17:169970)Code start: 0x41802f000000 VMK uptime: 6:00:01:30.899 2019-06-24T08:43:40.023Z cpu17:169970)0x43923f91bd30:[0x41802f30155a]Sched_SysServiceDone@vmkernel#nover+0x8a stack: 0xfc40a085 2019-06-24T08:43:40.023Z cpu17:169970)0x43923f91bd90:[0x41802f126e31]WorldletBHHandler@vmkernel#nover+0xe1 stack: 0x418042800c00 2019-06-24T08:43:40.024Z cpu17:169970)0x43923f91bef0:[0x41802f0b1db0]BH_DrainAndDisableInterrupts@vmkernel#nover+0x100 stack: 0x0 2019-06-24T08:43:40.024Z cpu17:169970)0x43923f91bf80:[0x41802f11a186]VMMVMKCall_Call@vmkernel#nover+0x196 stack: 0x43923f91bfec 2019-06-24T08:43:40.025Z cpu17:169970)0x43923f91bfe0:[0x41802f14b8a2]VMKVMM_ArchEnterVMKernel@vmkernel#nover+0xe stack: 0x41802f14b894 2019-06-24T08:43:40.028Z cpu17:169970)base fs=0x0 gs=0x418044400000 Kgs=0x0
Cause
A engenharia da VMware determinou que esse problema é causado por uma anomalia de preempção, resultando em contexto aleatório em pane no SchedSysServiceContextPut().
O PowerPath/VE para VMware 6.3, 6.4 e 6.5 tem um problema no recurso de impressão digital do aplicativo que pode causar uma anomalia de preempção.
Resolution
Ao solucionar esse problema internamente, foi descoberto um problema do PowerPath/VE relacionado ao recurso de impressão digital do aplicativo. Embora não possamos ter 100% de certeza de que é a causa do pânico visto pelo usuário, por precaução, estamos recomendando a qualquer usuário que tenha experimentado esse tipo de pânico para desativar o recurso de impressão digital do aplicativo.
Solução temporária (aplicável somente se estiver abaixo do microcódigo 5978.221 do Symmetrix):
Desative a impressão digital do aplicativo.
Resolução:
Faça upgrade para o PowerPath/VE 7.0 P01 ou uma versão posterior que esteja atualmente disponível para download no site de suporte da Dell.
Additional Information
Abaixo estão os comandos rpowermt para exibir e desativar o recurso "impressão digital do aplicativo".
Para verificar se o recurso está ativado:
# rpowermt display options host=<ESXi host name/IP> Show CLARiiON LUN names: true Path Latency Monitor: Off Performance Monitor: disabled Autostandby: IOs per Failure (iopf): enabled iopf aging period : 1 d iopf limit : 6000 Storage System Class Attributes ------------ ---------- Symmetrix periodic autorestore = on reactive autorestore = on auto host registration = enabled app finger printing = enabled device to array performance report = enabled device in use to array report = enabled
Para desativar o recurso:
# rpowermt set app_finger_printing=off host=<ESXi host name/IP>
Para verificar se o recurso está desativado:
# rpowermt display options host=<ESXi host name/IP> Show CLARiiON LUN names: true Path Latency Monitor: Off Performance Monitor: disabled Autostandby: IOs per Failure (iopf): enabled iopf aging period : 1 d iopf limit : 6000 Storage System Class Attributes ------------ ---------- Symmetrix periodic autorestore = on reactive autorestore = on auto host registration = enabled app finger printing = disabled device to array performance report = enabled device in use to array report = enabled
- Essa ativação/desativação de recursos não exige nenhuma atividade de manutenção nos hosts do ESXi e é persistente nas reinicializações.
- Não há alterações necessárias no array associado a esse recurso.
- Essa solução temporária só é aplicável ao microcódigo do Symmetrix abaixo de 5978.221.
- A partir do microcódigo 5978.221 do Symmetrix, a marcação de E/S é habilitada no Symmetrix, o que aciona um defeito no PowerPath/VE que causa uma PSOD.