PowerPath/VE: VMware ESXi 패닉 메시지: "vmm0 환경에서 #PF 예외 14"
Summary: VMware ESXi #PF 예외 14
Symptoms
OS: VMware ESXi 6.5.0 빌드
Dell 소프트웨어: PowerPath/VE 6.3(빌드 105)
Dell 소프트웨어: PowerPath/VE 6.4(빌드 103)
Dell 소프트웨어: PowerPath/VE 6.5(빌드 110)
Dell 하드웨어: Symmetrix
명백한 트리거 이벤트가 없는 예기치 않은 VMware ESXi Server 패닉
이 문제에 노출되려면 5978 코드 이상을 실행하는 PowerPath/VE 및 Symmetrix가 필요합니다.
2019-06-11T05:56:03.906Z cpu23:47993633)@BlueScreen: #PF Exception 14 in world 47993633:vmm0:FRAJXSA IP 0x418024500c9a addr 0x410006dcffc4 PTEs:0x8000853023;0x800082e023;0x80008a0023;0x0; 2019-06-11T05:56:03.907Z cpu23:47993633)Code start: 0x418024200000 VMK uptime: 69:00:05:14.200 2019-06-11T05:56:03.907Z cpu23:47993633)0x43941909bb50:[0x418024500c9a]Sched_SysServiceDone@vmkernel#nover+0x8a stack: 0x439dcb2afe80 2019-06-11T05:56:03.907Z cpu23:47993633)0x43941909bbb0:[0x4180245360ce]SCSICompleteAdapterCommand@vmkernel#nover+0x152 stack: 0x410006dd0040 2019-06-11T05:56:03.908Z cpu23:47993633)0x43941909bc30:[0x418024b69a09]SCSILinuxWorldletFn@com.vmware.driverAPI#9.2+0x3f1 stack: 0x4180242d1a38 2019-06-11T05:56:03.908Z cpu23:47993633)0x43941909bd90:[0x418024326ea8]WorldletBHHandler@vmkernel#nover+0x478 stack: 0x0 2019-06-11T05:56:03.909Z cpu23:47993633)0x43941909bef0:[0x4180242b1cb0]BH_DrainAndDisableInterrupts@vmkernel#nover+0x100 stack: 0x0 2019-06-11T05:56:03.909Z cpu23:47993633)0x43941909bf80:[0x418024319e66]VMMVMKCall_Call@vmkernel#nover+0x196 stack: 0x43941909bfec 2019-06-11T05:56:03.910Z cpu23:47993633)0x43941909bfe0:[0x41802434b8a2]VMKVMM_ArchEnterVMKernel@vmkernel#nover+0xe stack: 0x41802434b894 2019-06-11T05:56:03.913Z cpu23:47993633)base fs=0x0 gs=0x418045c00000 Kgs=0x0 2019-06-24T08:43:40.022Z cpu17:169970)@BlueScreen: #PF Exception 14 in world 169970:vmm0:FRAWINE IP 0x41802f30155a addr 0x410006d6ffc4 PTEs:0x8000053023;0x800002b023;0x800009e023;0x0; 2019-06-24T08:43:40.023Z cpu17:169970)Code start: 0x41802f000000 VMK uptime: 6:00:01:30.899 2019-06-24T08:43:40.023Z cpu17:169970)0x43923f91bd30:[0x41802f30155a]Sched_SysServiceDone@vmkernel#nover+0x8a stack: 0xfc40a085 2019-06-24T08:43:40.023Z cpu17:169970)0x43923f91bd90:[0x41802f126e31]WorldletBHHandler@vmkernel#nover+0xe1 stack: 0x418042800c00 2019-06-24T08:43:40.024Z cpu17:169970)0x43923f91bef0:[0x41802f0b1db0]BH_DrainAndDisableInterrupts@vmkernel#nover+0x100 stack: 0x0 2019-06-24T08:43:40.024Z cpu17:169970)0x43923f91bf80:[0x41802f11a186]VMMVMKCall_Call@vmkernel#nover+0x196 stack: 0x43923f91bfec 2019-06-24T08:43:40.025Z cpu17:169970)0x43923f91bfe0:[0x41802f14b8a2]VMKVMM_ArchEnterVMKernel@vmkernel#nover+0xe stack: 0x41802f14b894 2019-06-24T08:43:40.028Z cpu17:169970)base fs=0x0 gs=0x418044400000 Kgs=0x0
Cause
VMware 엔지니어링 팀은 이 문제가 선점 이상 현상으로 인해 SchedSysServiceContextPut()에서 임의 컨텍스트 패닉이 발생한다는 것을 확인했습니다.
PowerPath/VE for VMware 6.3, 6.4 및 6.5에는 앱 지문 인쇄 기능에 선점 이상을 일으킬 수 있는 문제가 있습니다.
Resolution
내부적으로 이 문제를 해결하는 동안 앱 지문 인쇄 기능과 관련된 PowerPath/VE 문제가 발견되었습니다. 이것이 사용자가 보는 패닉의 원인이라고 100% 확신할 수는 없지만 예방 조치로 이러한 유형의 패닉을 경험한 모든 사용자는 앱 지문 기능을 비활성화할 것을 권장합니다.
해결 방법(Symmetrix 마이크로코드 5978.221 미만인 경우에만 해당):
앱 지문 인쇄를 비활성화합니다.
해상도:
현재 Dell 지원 웹사이트에서 다운로드할 수 있는 PowerPath/VE 7.0 P01 이상 릴리스로 업그레이드하십시오.
Additional Information
다음은 "앱 지문" 기능을 표시하고 비활성화하는 rpowermt 명령입니다.
기능이 활성화되어 있는지 확인하려면 다음을 수행합니다.
# rpowermt display options host=<ESXi host name/IP> Show CLARiiON LUN names: true Path Latency Monitor: Off Performance Monitor: disabled Autostandby: IOs per Failure (iopf): enabled iopf aging period : 1 d iopf limit : 6000 Storage System Class Attributes ------------ ---------- Symmetrix periodic autorestore = on reactive autorestore = on auto host registration = enabled app finger printing = enabled device to array performance report = enabled device in use to array report = enabled
이 기능을 끄려면:
# rpowermt set app_finger_printing=off host=<ESXi host name/IP>
이 기능이 비활성화되어 있는지 확인하려면 다음을 수행합니다.
# rpowermt display options host=<ESXi host name/IP> Show CLARiiON LUN names: true Path Latency Monitor: Off Performance Monitor: disabled Autostandby: IOs per Failure (iopf): enabled iopf aging period : 1 d iopf limit : 6000 Storage System Class Attributes ------------ ---------- Symmetrix periodic autorestore = on reactive autorestore = on auto host registration = enabled app finger printing = disabled device to array performance report = enabled device in use to array report = enabled
- 이 기능을 활성화/비활성화하기 위해 ESXi 호스트에 대한 유지 보수 작업이 필요하지 않으며 재부팅 후에도 지속됩니다.
- 이 기능과 관련된 어레이 측에서는 변경할 필요가 없습니다.
- 이 해결 방법은 Symmetrix 마이크로코드 5978.221 미만에만 적용됩니다.
- Symmetrix 마이크로코드 5978.221 이상부터는 Symmetrix에서 I/O 태그 지정이 활성화되어 PowerPath/VE의 결함을 트리거하여 PSOD가 발생합니다.