PowerPath/VE. Сообщение об ошибке VMware ESXi: «#PF Исключение 14 в мире vmm0»
Summary: VMware ESXi #PF, исключение 14
Symptoms
ОС: Сборка
VMware ESXi 6.5.0 для программного обеспечения Dell: PowerPath/VE 6.3 (сборка 105),
программное обеспечение Dell: PowerPath/VE 6.4 (сборка 103),
программное обеспечение Dell: PowerPath/VE 6.5 (сборка 110)
Оборудование Dell: Симметрикс
Непредвиденная критическая ошибка сервера VMware ESXi без очевидного события-триггера
Для устранения этой проблемы требуется PowerPath/VE и Symmetrix с кодом 5978 или более поздней версии.
2019-06-11T05:56:03.906Z cpu23:47993633)@BlueScreen: #PF Exception 14 in world 47993633:vmm0:FRAJXSA IP 0x418024500c9a addr 0x410006dcffc4 PTEs:0x8000853023;0x800082e023;0x80008a0023;0x0; 2019-06-11T05:56:03.907Z cpu23:47993633)Code start: 0x418024200000 VMK uptime: 69:00:05:14.200 2019-06-11T05:56:03.907Z cpu23:47993633)0x43941909bb50:[0x418024500c9a]Sched_SysServiceDone@vmkernel#nover+0x8a stack: 0x439dcb2afe80 2019-06-11T05:56:03.907Z cpu23:47993633)0x43941909bbb0:[0x4180245360ce]SCSICompleteAdapterCommand@vmkernel#nover+0x152 stack: 0x410006dd0040 2019-06-11T05:56:03.908Z cpu23:47993633)0x43941909bc30:[0x418024b69a09]SCSILinuxWorldletFn@com.vmware.driverAPI#9.2+0x3f1 stack: 0x4180242d1a38 2019-06-11T05:56:03.908Z cpu23:47993633)0x43941909bd90:[0x418024326ea8]WorldletBHHandler@vmkernel#nover+0x478 stack: 0x0 2019-06-11T05:56:03.909Z cpu23:47993633)0x43941909bef0:[0x4180242b1cb0]BH_DrainAndDisableInterrupts@vmkernel#nover+0x100 stack: 0x0 2019-06-11T05:56:03.909Z cpu23:47993633)0x43941909bf80:[0x418024319e66]VMMVMKCall_Call@vmkernel#nover+0x196 stack: 0x43941909bfec 2019-06-11T05:56:03.910Z cpu23:47993633)0x43941909bfe0:[0x41802434b8a2]VMKVMM_ArchEnterVMKernel@vmkernel#nover+0xe stack: 0x41802434b894 2019-06-11T05:56:03.913Z cpu23:47993633)base fs=0x0 gs=0x418045c00000 Kgs=0x0 2019-06-24T08:43:40.022Z cpu17:169970)@BlueScreen: #PF Exception 14 in world 169970:vmm0:FRAWINE IP 0x41802f30155a addr 0x410006d6ffc4 PTEs:0x8000053023;0x800002b023;0x800009e023;0x0; 2019-06-24T08:43:40.023Z cpu17:169970)Code start: 0x41802f000000 VMK uptime: 6:00:01:30.899 2019-06-24T08:43:40.023Z cpu17:169970)0x43923f91bd30:[0x41802f30155a]Sched_SysServiceDone@vmkernel#nover+0x8a stack: 0xfc40a085 2019-06-24T08:43:40.023Z cpu17:169970)0x43923f91bd90:[0x41802f126e31]WorldletBHHandler@vmkernel#nover+0xe1 stack: 0x418042800c00 2019-06-24T08:43:40.024Z cpu17:169970)0x43923f91bef0:[0x41802f0b1db0]BH_DrainAndDisableInterrupts@vmkernel#nover+0x100 stack: 0x0 2019-06-24T08:43:40.024Z cpu17:169970)0x43923f91bf80:[0x41802f11a186]VMMVMKCall_Call@vmkernel#nover+0x196 stack: 0x43923f91bfec 2019-06-24T08:43:40.025Z cpu17:169970)0x43923f91bfe0:[0x41802f14b8a2]VMKVMM_ArchEnterVMKernel@vmkernel#nover+0xe stack: 0x41802f14b894 2019-06-24T08:43:40.028Z cpu17:169970)base fs=0x0 gs=0x418044400000 Kgs=0x0
Cause
Специалисты инженерного отдела VMware определили, что эта проблема вызвана аномалией вытеснения, которая приводит к панике случайного контекста в SchedSysServiceContextPut().
В PowerPath/VE для VMware 6.3, 6.4 и 6.5 имеется проблема в функции сканера отпечатков пальцев приложений, которая может привести к аномалии вытеснения.
Resolution
Во время внутреннего поиска и устранения этой проблемы в PowerPath/VE была обнаружена проблема, связанная с функцией распознавания отпечатков пальцев приложений. Хотя мы не можем быть на 100% уверены, что это причина паники, которую видит пользователь, в качестве меры предосторожности мы рекомендуем любому пользователю, столкнувшемуся с этим типом паники, отключить функцию отпечатков пальцев приложения.
Временное решение (применимо, только если указано ниже микрокод Symmetrix 5978.221):
Отключите снятие отпечатков пальцев в приложениях.
Резолюция:
Выполните модернизацию до PowerPath/VE 7.0 P01 или более поздней версии, которую в настоящее время можно скачать на веб-сайте онлайн-поддержки Dell.
Additional Information
Ниже приведены команды rpowermt для отображения и отключения функции «App Finger Fingerprinting».
Чтобы проверить, включена ли эта функция, выполните следующие действия.
# rpowermt display options host=<ESXi host name/IP> Show CLARiiON LUN names: true Path Latency Monitor: Off Performance Monitor: disabled Autostandby: IOs per Failure (iopf): enabled iopf aging period : 1 d iopf limit : 6000 Storage System Class Attributes ------------ ---------- Symmetrix periodic autorestore = on reactive autorestore = on auto host registration = enabled app finger printing = enabled device to array performance report = enabled device in use to array report = enabled
Чтобы отключить эту функцию, выполните следующие действия.
# rpowermt set app_finger_printing=off host=<ESXi host name/IP>
Чтобы проверить, отключена ли эта функция, выполните следующие действия.
# rpowermt display options host=<ESXi host name/IP> Show CLARiiON LUN names: true Path Latency Monitor: Off Performance Monitor: disabled Autostandby: IOs per Failure (iopf): enabled iopf aging period : 1 d iopf limit : 6000 Storage System Class Attributes ------------ ---------- Symmetrix periodic autorestore = on reactive autorestore = on auto host registration = enabled app finger printing = disabled device to array performance report = enabled device in use to array report = enabled
- Включение или отключение этой функции не требует выполнения каких-либо действий по обслуживанию на хостах ESXi и не прекращается при перезагрузках.
- С этой функцией не требуется никаких изменений на стороне массива.
- Это временное решение применимо только для микрокода Symmetrix ниже 5978.221.
- Начиная с микрокода Symmetrix 5978.221 и более поздних версий, в Symmetrix включена маркировка ввода-вывода, что вызывает дефект PowerPath/VE, вызывающий PSOD.