跳转至主要内容
  • 快速、轻松地下订单
  • 查看订单并跟踪您的发货状态
  • 创建并访问您的产品列表
  • 使用“Company Administration”(公司管理),管理Dell EMC站点、产品和产品级联系人。

Dell PowerEdge 14G : ESXi renvoie le message d’erreur « Failed to Initialize NVML: Unknown Error » avec un processeur graphique Nvidia

摘要: Pour résoudre ce problème, définissez le paramètre Memory Mapped I/O Base sur une valeur de 512 Go

本文可能已自动翻译。如果您对其质量有任何反馈,请使用此页面底部的表单告知我们。

文章内容


症状

Description

Lors de la tentative d’installation d’un processeur graphique Nvidia (p. ex. M10) sur un serveur 14G (R740 et R740XD) pris en charge, il est possible que l’erreur suivante s’affiche lorsque vous tentez d’exécuter la commande nvidia-smi après l’installation du pilote vib :

[root@localhost:~] nvidia-smi
Failed to initialize NVML: Unknown Error


SLN308065_en_US__1PSE2940error


La section /var/log/vmkernel.log du fichier nvidia-bug-report.log indique des événements semblables à ce qui suit :

2017-11-02T18:28:19.707Z cpu45:66263)NVRM: loading NVIDIA UNIX x86_64 Kernel Module  384.73  Mon Aug 21 15:16:25 PDT 2017
2017-11-02T18:28:19.710Z cpu3:66145)NVRM: This is a 64-bit BAR mapped above 16 TB by the system
NVRM: BIOS or the VMware ESXi kernel. This PCI I/O region assigned
NVRM: to your NVIDIA device is not supported by the kernel.
NVRM: BAR1 is 256M @ 0x382fe00$



 


Solution

Le matériel fonctionne correctement. Pour résoudre ce problème, définissez le paramètre Memory Mapped I/O Base sur 512 Go (la valeur par défaut est 56 To) ou 12 To (si le serveur dispose de plus de 512 Go de RAM) :

SLN308065_en_US__2PSE2940biossetting


Ce problème est détaillé dans le manuel d’utilisation du matériel R740 :

Memory Mapped I/O above 4 GB : permet d’activer ou de désactiver la prise en charge des périphériques PCIe qui nécessitent de grandes quantités de mémoire. Activez cette option uniquement pour les systèmes d’exploitation 64 bits. Cette option est activée par défaut.

Memory Mapped I/O above Base : lorsque ce paramètre est défini sur une valeur de 12 To, le système mappe la base MMIO à 12 To. Activez cette option pour un système d’exploitation qui nécessite un adressage PCIe de 44 bits.
Lorsqu’il est défini sur 512 Go, le système mappe la base MMIO à 512 Go et réduit la prise en charge maximale de la mémoire à moins de 512 Go. Activez cette option uniquement pour la version DGMA à 4 processeurs graphiques. Par défaut, cette option est définie sur 56 To.

http://topics-cdn.dell.com/pdf/poweredge-r740_owner's%20manual_en-us.pdf (page 52)

 

SLN308065_en_US__3icon Notez que cela limite la mémoire système à 512 Go (si ce paramètre est défini sur 512 Go).

 

Une fois que ce paramètre a été modifié et que le système a redémarré, la commande nvidia-smi doit retourner un résultat semblable à celui-ci :

SLN308065_en_US__4PSE2940noerror

原因

-

解决方案

-

文章属性


受影响的产品

PowerEdge R740, PowerEdge R740XD, PowerEdge T640

上次发布日期

07 10月 2021

版本

4

文章类型

Solution